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尼 尔 . 丁 ' 萨 尔 金 德 (Neil J. Salkind) 他 在 堪萨斯 大 学 心理 学 和 教育 学 系 从 教 
30 年 ,同时 兼任 人 类 发 展 和 家 庭 生活 系 的 教授 ,30 年 来 ,开设 的 课程 有 发 展 理论 、 生 命 
全 程 发 展 理论 、 统 计 学 和 研究 方法 。 他 获得 马里 兰 大 学 人 类 发 展 的 博士 学 位 ,发 表 了 
80 多 篇 专业 文章 ,也 是 一 些 大 学 教材 的 作者 ,如 《儿童 发 展 、 探 索性 研究 和 人 类 发 展 理 
论 导论 》(Sage,2004) 。 他 也 是 1989—2002 年 的 4 儿童 发 展 摘要 和 书目 》 的 编辑 。 他 
在 儿童 发 展 研究 领域 很 活跃 ,在 贸易 领域 也 有 很 多 著述 。 他 住 在 堪萨斯 州 劳伦斯 市 一 
所 需要 经 常 维护 的 老 房 子 里 ,喜欢 误 饪 游泳 阅读、 藏书 及 收藏 古典 沃 尔 夫 P1800。 


给 学 生 的 话 : 
我 为 什么 写 这 本 书 





我 很 幸运 ,三 十 年 来 能 够 在 堪萨斯 大 学 给 成 千 上 万 的 学 生 讲 授 基 础 统计 学 。 他 们 
中 的 大 多 数 (至 少 在 这 门 课 开始 时 ) 都 相当 的 焦虑 ,焦虑 的 原因 通常 是 他 们 从 其 他 学 
生 那 里 听 来 的 经 验 之 谈 。 一 般 来 说 ,他 们 听 到 的 一 小 部 分 是 正确 的 一 一 学 习 统计 学 要 
投入 很 多 的 时 间 和 精力 (而 且 偶 尔 还 会 遇 到 “怪物 型 "老师 )。 但 是 他 们 听 到 的 大 部 
分 一 一 统计 学 特别 难 学 , 令 人 困扰 一 一 是 不 正确 的 ,这 恰恰 是 他 们 产生 焦虑 的 原因 。 
而 实际 上 许多 被 吓 倒 的 学 生 都 通过 了 他 们 以 为 不 能 通过 的 课程 。 只 要 集中 精力 , 按 部 
就 班 ,将 基本 原理 应 用 于 真实 的 生活 来 理解 ,他 们 都 能 通过 这 门 课程 ,甚至 能 够 在 这 个 
过 程 中 得 到 乐趣 。 这 就 是 我 在 写 4 爱 上 统计 学 》 第 1 版 的 时 候 想 尽力 做 到 的 ,在 这 一 
版 的 修订 中 我 更 加 努力 做 到 这 一 点 。 

在 经 过 不 断 地 摸索 以 及 少量 成 功 大 量 失败 的 尝试 之 后 ,我 已 经 学 会 了 以 某 种 方式 
教授 统计 学 ,我 和 我 的 许多 学 生 认 为 这 种 方式 不 会 让 人 感到 害怕 ,同时 能 够 传递 大 量 
的 信息 。 

通过 这 本 书 可 以 了 解 基础 统计 学 的 范围 并 学 习 所 有 应 该 掌握 的 信息 ,也 可 以 了 解 
整理 和 分 析 数 据 的 基本 思路 和 最 常用 的 技术 。 本 书 理论 部 分 有 一 些 , 但 是 很 少 ,数学 
证 明 或 特定 数学 程式 的 合理 性 讨论 也 很 少 。 

为 什么 《 爱 上 统计 学 》 这 本 书 不 增加 更 多 理论 内 容 ? 很 简单 ， 初学 者 不 需要 。 这 
并 不 是 我 认为 理论 不 重要 ,而 是 在 学 习 的 这 个 阶段 ,我 想 提 供 的 是 我 认为 通过 一 定 程 
度 的 努力 可 以 理解 和 掌握 的 资料 ,同时 又 不 会 让 你 感到 害怕 而 放弃 将 来 选修 更 多 的 课 
程 。 我 和 其 他 老师 都 希望 你 能 成 功 。 

因此 ,如 果 你 想 详细 了 解 方差 分 析 中 了 值 的 含义 ,可 以 从 Sage 出 版 社 查找 其 他 的 
好 书 (我 愿意 向 你 推荐 书目 ) 。 但 是 如 果 你 想 了 解 统计 学 为 什么 以 及 如 何 为 你 所 用 ， 
这 本 书 很 合适 。 这 本 书 能 帮助 你 理解 在 专业 文章 中 看 到 的 资料 ,解释 许多 统计 分 析 结 
果 的 意义 ,并 且 能 教 你 运用 基本 的 统计 过 程 。 

祝 大 家 好 运 ,希望 你 们 能 让 我 知道 如 何 修订 这 本 书 才能 更 好 地 满足 初学 统计 学 的 
学 生 的 需求 。 


致 谢 


一 本 好 书 是 好 的 编辑 和 作者 共同 努力 的 结果 。 如 果 这 本 书 真 的 实现 了 最 初 的 设 
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米 软 尔 . 李 . 肯 尼 (Michelle Lee Kenny), 

最 后 ,与 通常 一 样 感谢 一 位 具有 非凡 魅力 的 女性 一 一 莱 尼 (Leni) 。 


现在 ,关于 第 2 版 ааа 


以 上 的 内 容 说 明了 我 写 这 本 书 的 最 初 想法 ,但 是 关于 新 的 版 本 介绍 很 少 。 

任何 一 本 书 都 需要 不 断 修 订 《 爱 上 统计 学 》 也 不 例外 。 过 去 的 三 年 许多 人 曾 告 
诉 我 这 本 书 是 多 么 的 有 帮助 ,但 是 其 他 人 也 告诉 我 他 们 多 么 想 让 这 本 书 做 出 修订 以 及 
为 什么 。 在 修订 的 过 程 中 我 尽力 满足 这 两 方面 人 的 需求 。 书 中 部 分 内 容 仍 保留 ,部 分 
做 出 了 修订 。 

总 是 有 新 的 事物 值得 关注 ,同时 也 需要 用 不 同 的 方式 重新 理解 老 的 主题 和 观念 。 
以 下 的 清单 是 4 爱 上 统计 学 》 中 新 的 内 容 。 

。 第 9 章 新 增 了 效果 值 的 简要 介绍 ,这 部 分 在 第 一 版 编辑 过 程 中 被 删 减 了 。 新 增 
的 目的 是 让 学 生 对 差异 的 重要 性 有 更 深入 的 认识 。 

e 你 会 发 现 新 增 了 第 12 章 一 一 析 因 方差 分 析 。 虽 然 第 一 版 的 一 维 分 析 对 一 些 人 
已 经 足够 ,但 是 新 增 的 这 一 章 可 进一步 满足 其 他 人 更 多 的 需要 。 

e 研究 设计 和 统计 分 析 中 总 是 要 考虑 测量 结果 的 工具 和 有 效 性 检验 。 考 虑 到 这 一 
点 ,第 16 章 增加 了 信和 度 和 效 度 的 重要 形式 和 相关 问题 的 简要 综述 。 

° 每 一 章 后 都 增加 了 更 多 的 练习 题 ,许多 习题 可 以 用 到 本 书 附录 С 的 数据 教师 
资源 光盘 的 数据 或 http://www. soe. ku. edu/faculty/salkind/stats_fpwhs/ 的 在 线 
数据 。 在 线 数据 可 以 依据 需要 下 载 。 

ө 现在 的 数据 库 一 般 有 两 种 形式 SPSS( 流 行 的 统计 分 析 软 件 ) 和 Excel( 许 多 
人 使 用 电子 表格 分 析 数 据 ) 。 

e 第 1 版 中 出 现 的 所 有 错误 都 是 我 的 责任 ,我 向 被 这 些 错误 困扰 的 老师 和 学 生 道 
歉 。 我 非常 感谢 所 有 那些 指正 错误 并 使 得 第 2 版 更 好 的 信件 、 电 话 和 电子 邮 
件 。 在 这 一 版 ,我 们 每 个 人 都 尽力 修改 错误 ,并 希望 工作 做 得 更 好 。 期 望 能 收 
到 大 家 的 建议 ,批评 和 意见 。 祝 大 家 好 运 。 





尼 尔 * J - 萨 尔 金 德 
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这 有 什么 好 欢呼 的 ,你 会 这 样 说 吗 ? 现在 给 我 几 分 钟 的 时 间 向 你 展示 一 些 
非常 成 功 的 科学 家 如 何 使 用 被 广泛 使 用 的 叫做 统计 学 的 工具 。 


e KIKIR • 兰 普尔 ( Michelle Lampl) 是 艾 莫 里 大 学 的 儿科 专家 和 人 类 学 家 。 她 和 
朋友 喝 咖 啡 的 时 候 , 朋友 谈 到 她 的 孩子 长 得 多 么 多 么 的 快 。 实 际 上 ,这 个 初 为 
人 母 的 朋友 几乎 是 说 她 的 儿子 " 像 野 草 一 样 疯 长 "。 兰 普尔 博士 十 分 的 好 奇 
( 像 所 有 的 科学 家 对 事物 感到 好 奇 一 样 ) ,她 想 她 应 该 实际 测量 这 个 孩子 以 及 
其 他 孩子 在 婴儿 期 的 生长 速度 。 她 着 手 测量 一 群 孩子 每 天 的 生长 ,让 她 非常 
吃惊 的 是 她 发 现 一 些 婴 儿 差 不 多 一 个 晚上 就 长 一 英寸 ! 确实 是 爆发 式 生长 。 

想 知道 更 多 吗 ? 请 阅读 原著 :你 可 以 从 兰 普尔 、 费 尔 德 伊 斯 和 约翰 森 ( Lamp， 

M. ,Veldhuis ,J. D. ,and Johnson , М. L. ) (1992) 发 表 在 《科学 》258 期 801 ~ 803 页 

上 的 文章 "突变 和 停滞 :人 类 生长 模式 ( Saltation and stasis: А Model of human 

growth. ) 中 了 解 更 多 。 


(Ж. 肯 珀 (Sue Kemper) 是 堪萨斯 大 学 心理 学 教授 ,曾经 研究 许多 非常 有 趣 的 项 
目 。 她 和 其 他 的 研究 者 正在 研究 修女 群体 ,分 析 他 们 的 早期 经 验 、 活 动人 格 
特征 和 其 他 信息 与 他 们 中 年 以 后 的 健康 状况 之 间 的 关系 。 最 特别 的 是 这 个 由 
不 同 科学 家 组 成 的 小 组 (包括 心理 学 家 、 语 言 学 家 和 神经 学 家 ,等 等 ) 想 知道 所 
有 信息 多 大 程度 上 可 以 预测 老年 痴呆 病 的 发 生 。 她 发 现 修女 在 20 多 岁 时 写 
作 的 复杂 性 和 他 们 在 50,60 年 或 者 70 年 后 患 上 老年 痴呆 病 的 可 能 性 有 关 。 


想 知 道 更 多 吗 ? 请 阅读 原著 :你 可 以 从 斯 诺顿 、 肯 珀 、 莫 蒂 默 .格雷 纳 、 韦 斯 
坦 因 和 马克 斯 贝 里 ( Snowdon , D. А. ,Кетрег,5. J. , Mortimer, J. A. ,Greiner,L. Н., 
Wekstein, D. A. ‚апа Markesbery , W. R. ) (1996) 发 表 在 《美国 医学 协会 杂志 》275 
期 528 ~532 页 上 的 文章 "早期 生活 的 语言 能 力 和 认 知 功能 与 晚期 生活 的 老年 痴 
采 症 : 修女 研究 的 发 现 ( Linguistic ability іп early life and cognitive function апа 
Alzheimer’ s disease іп late life : Findings from the nun study. ) "中 了 解 更 多 。 


e 阿 莱 水 "休斯顿 (Aletha Huston ) 是 德州 大 学 奥斯汀 分 校 的 研究 者 和 教师 ,投入 
大 量 的 研究 来 发 现 看 电视 对 幼儿 心理 发 展 的 作用 。 其 中 之 一 的 工作 是 她 和 她 
后 来 的 丈夫 约翰 。 赖 特 (John. С. Wright) 调查 入 学 前 观看 一 定量 的 电视 教育 节 
目 对 入 学 后 学 习 的 影响 。 他 们 发 现 了 确实 的 证 据 可 证 明 观 看 教育 节目 如 《 罗 
杰 斯 先生 》 或 4 芝麻 街 》 的 儿童 比 没有 看 的 儿童 在 学 校 表 现 得 更 好 。 


想 知 道 更 多 吗 ? 请 读 原著 : 你 可 以 从 柯林斯 、 赖 特 、 安 德 森 、 休 斯 顿 . 施 密 特 
AH2Z LZ (Collins, P. A. ,Wright,J. C. , Anderson, D. R. , Huston, A. C. ,Schmitt, 
K. апа MeElroy , E. ) ( 1997 ) 提交 于 在 美国 阿尔 伯 克 基 举行 的 儿童 发 展 研究 协会 
年 会 的 论文 "幼儿 时 期 媒体 教育 对 青少年 学 习 成 绩 的 影响 ( Effects of early child- 
hood media изе оп adolescent achiuement. ) "中 了 解 更 多 。 

所 有 的 研究 者 都 有 一 个 特别 的 问题 ,他 们 对 这 个 问题 有 兴趣 并 用 他 们 的 直 
觉 . 好 奇 心 和 学 术 训练 来 回答 这 个 问题 。 作 为 调查 的 一 部 分 ,他 们 使 用 我 们 称 作 
统计 学 的 工具 分 析 所 收集 到 的 所 有 资料 的 意义 。 如 果 没 有 这 些 工 具 , 所 有 的 资 
料 就 是 不 相关 的 资料 的 汇集 。 那 么 这 些 资料 就 不 能 在 兰 普尔 的 研究 中 用 于 得 出 
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儿童 生长 的 结论 ,不 能 在 肯 珀 的 研究 中 用 于 对 老年 痴呆 病 有 更 好 的 理解 ,也 不 能 
在 休斯顿 和 赖 特 的 研究 中 用 于 更 好 地 理解 看 电视 对 幼儿 学 习 和 社会 发 展 的 
影响 。 

统计 学 一 一 整理 和 分 析 资 料 并 使 得 资料 更 容易 理解 的 科学 一 一 使 得 研究 任 
务 可 行 。 

通过 这 样 的 研究 所 得 出 的 任何 结论 都 是 有 用 的 ,原因 是 我 们 使 用 统计 学 使 
得 这 些 结果 有 意义 。 这 也 正 是 本 书 的 目标 一 一 让 你 理解 这 些 基本 的 工具 以 及 这 
些 工具 的 用 途 , 当然 也 包括 如 何 使 用 这 些 工 具 。 

在 《 爱 上 统计 学 ) 的 第 I 部 分 介绍 统计 学 学 习 的 内 容 , 以 及 为 什么 值得 花费 
精力 来 掌握 这 个 领域 关键 的 基本 术语 和 思路 。 这 都 是 学 习 本 书 其 他 部 分 的 
准备 。 
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本 章 你 会 学 到 什么 


о 统计 学 的 学 习 内 容 
° 为 什么 学 习 统 计 学 
° 如 何 通过 这 门 课程 的 考试 


为 什么 学 习 统 计 学 


你 以 前 肯定 听 到 过 “统计 学 很 难 学 ”,“ 统 计 中 相关 的 数学 部 分 很 难 
应 付 ”,“ 我 不 知道 怎么 用 电脑 ”,“ 学 统计 学 有 什么 用 ”,“ 接 下 来 做 什么 ”， 
还 有 就 是 统计 学 导论 课 上 学 生 的 著名 呐喊 ,“ 我 就 是 不 懂 !1” 

好 啦 , 放 松 些 。 学 习 统 计 学 导论 的 学 生 总 会 发 现 他 们 自己 时 不 时 有 以 
上 的 想法 ,如 果 他 们 不 和 其 他 学 生 或 者 他 们 的 爱人 、 同 事 或 者 朋友 交流 的 
W ,他 们 至 少 有 上 面 的 一 个 想法 。 

而 且 , 不 是 开玩笑 ,一些 统 计 学 课程 很 容易 被 描述 为 虐待 学 。 这 是 由 
于 那些 书 无 一 例外 地 让 人 厌烦 ,而 且 作 者 没有 想象 力 。 

本 书 将 改变 这 种 状况 。 事 实 是 ,你 或 者 你 的 老师 选择 了 《 爱 上 统计 
学 》, 这 表明 你 准备 选择 正确 的 方法 不 会 让 人 害怕 、 信 息 充 分 并 且 很 
实用 (甚至 有 趣 ) 的 方法 ,而 且 尽 可 能 地 教 你 应 用 这 一 有 价值 的 工具 一 一 
统计 学 的 确 是 有 价值 的 工具 ,需要 知道 些 什么 。 

如 果 选 用 这 本 书 作为 教材 ,这 也 意味 着 你 的 老师 明显 地 站 在 你 的 立场 
上 一 一 他 或 她 知道 统计 学 是 让 人 害怕 的 ,但 他 们 已 经 采取 措施 来 确保 统计 
学 不 会 让 你 害怕 。 事 实 上 ,我 敢 打赌 你 在 几 个 星期 之 后 享受 这 门 课程 的 机 
会 很 大 (这 同样 也 难以 让 人 相信 )。 


统计 学 简 史 


在 阅读 更 多 内 容 之 前 ,有 必要 从 历史 的 视角 了 解 统计 学 。 你 知道 , 毕 
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竟 几 乎 所 有 的 社会 科学 行为 科学 、 生 物 学 的 大 学 生 和 教育 学 、 护 理学 、 心 
理学 .社会 福利 和 社会 服务 以 及 人 类 学 的 研究 生 都 需要 选修 这 门 课 。 了 解 
统计 学 应 用 领域 从 何 处 开始 是 否 有 必要 ? 回答 是 当然 有 必要 。 

只 要 回顾 过 去 ,人 们 就 会 发 现 计数 是 个 非常 好 的 创意 (就 如 “你 需要 
多 少 这 个 来 交换 那些 中 的 一 个 ”) ,同样 收集 信息 也 成 为 有 用 的 技能 。 如 
果 用 到 计数 ,人 们 就 会 知道 太阳 在 一 季 升 起 多 少 次 , 度 过 整个 冬天 需要 多 
少食 物 ,以 及 一 个 人 拥有 多 少 资源 。 

这 只 是 开始 。 一 旦 数字 成 为 语言 的 组 成 部 分 ,似乎 接 下 来 的 步骤 就 是 
将 数字 和 结果 结合 在 一 起 。 在 17 世纪 早期 就 开始 收集 与 人 口 相 关 的 数 
据 。 以 此 为 基础 ,科学 家 (大 多 数 是 数学 家 ,此 外 是 物理 学 家 和 生物 学 家 ) 
需要 发 展 特 定 的 工具 来 回答 特定 的 问题 。 例 如 , 弗 兰 茨 加 和 尔 东 (Francis 
Galton) (顺便 说 一 下 ,他 是 达尔 文 的 表 兄 弟 , 生 卒 年 代 是 1822—1911 年 )， 
他 对 人 类 智力 的 性 质 非 常 感 兴趣 。 为 回答 家 庭 成 员 智 力 一 致 性 的 基本 问 
题 ,他 使 用 了 特定 的 统计 工具 一 一 相关 系数 (首先 是 数学 家 发 展 的 ) ,接着 
他 把 相关 系数 广泛 地 应 用 于 行为 科学 和 社会 科学 。 你 会 在 第 五 章 对 这 个 
工具 有 全 面 的 了 解 。 

实际 上 ,你 将 学 到 的 大 多 数 基本 统计 过 程 最 初 应 用 于 农业 、 天 文学 其 
至 政治 学 领域 。 在 人 类 行为 领域 的 应 用 则 比较 晚 。 

在 过 去 的 100 年 中 ,在 发 明 新 方法 应 用 旧 观 念 方 面 取 得 了 极 大 的 进 
步 。 最 简单 的 用 于 比较 两 个 群体 的 均值 差异 的 检验 方法 在 20 世纪 初 取 得 
首次 进展 。 在 此 基础 上 建立 的 技术 十 年 之 后 才 提 出 ,而且 得 到 了 极 大 的 完 
善 。 随 着 个 人 电脑 和 类 似 SPSS 的 软件 ( 见 附录 A) 的 应 用 ,任何 人 想 研究 
这 些 有 意义 问题 都 可 以 使 用 复杂 的 统计 技术 。 

影响 力 深远 的 个 人 电脑 的 应 用 有 利 有 弊 。 有 利 的 方面 是 大 多 数 统计 
分 析 不 再 需要 使 用 巨大 、 昂 贵 的 中 央 处 理 机 。 而 价值 不 超过 1 000 美元 的 
个 人 电脑 就 能 满足 95% 的 人 95% 的 需求 。 另 一 方面 ,很 少 有 大 学 生 ( 如 已 
经 通过 这 门 课 的 你 的 同学 ) 会 使 用 他 们 已 有 的 旧 数 据 ,并 且 认 为 应 用 复杂 
的 SPSS 软件 分 析 这 些 数 据 可 以 得 到 可 靠 、 可 信和 有 意义 的 结果 一 一 这 是 
不 正确 的 。 你 的 老师 可 能 会 说 “垃圾 进 ,垃圾 出 ”一 一 如 果 你 开始 就 没有 
使 用 可 靠 、 可 信 的 数据 ,那么 分 析 这 样 的 数据 所 得 到 的 结果 就 既 不 可 信也 
不 可 靠 。 

现在 ,不 同 领域 一 一 从 司法 、 地 球 物理 学 到 心理 学 一 一 的 统计 分 析 人 
员 发 现 他 们 基本 上 使 用 相同 的 技术 来 回答 不 同 的 问题 。 当 然 在 资料 收集 
方面 有 重要 的 差别 ,但 是 大 体 上 来 说 , 随 着 数据 (大 量 的 数据 ) 收集 所 进行 
的 分 析 ( 多 个 的 分 析 ) ,即使 说 有 所 谓 的 差别 也 是 非常 类 似 的 。 那 么 伦理 
问题 呢 ? 这 个 课 上 会 给 你 提供 一 定 的 工具 来 理解 统计 学 如 何 应 用 于 几乎 
任何 一 个 学 科 中 , 帮 你 轻松 搞定 那些 3 ~4 MERRE 

如 果 你 想 更 多 地 了 解 统计 学 历史 ,而 且 想 按 历史 发 展 来 了 解 ,可 以 从 
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一 个 很 好 的 地 方 开 始 ,就 是 圣 安 赛 姆 学 院 的 网 络 , 网 址 是 http://www. an- 
selm. edu/ hompage/jpitocch/biostatshist. html; 或 者 http://www. stat. ucla. 


edu/history/( 加 利 福 尼 亚 大 学 洛杉矶 分 校 ) 。 
统计 学 :是 什么 (或 不 是 什么 ) 


《 爱 上 统计 学 ?是 一 本 关于 基础 统计 学 ,以 及 在 不 同 的 情况 下 如 何 应 
用 统计 学 分 析 和 理解 资料 的 书 。 

就 一 般 意 义 而 言 ,统计 学 是 描述 一 系列 可 用 于 描述 .整理 和 解释 资料 
或 数据 的 统计 工具 和 技术 。 这 些 数据 可 能 是 特定 数学 课程 的 学 生 的 考试 
得 分 、 解 决 问题 的 速度 、 吃 某 种 药 感到 不 适 的 病人 人 数 .世界 系列 大 赛 每 一 
局 出 错 的 次 数 或 者 圣 达 菲 高 级 餐厅 晚餐 的 平均 价格 。 

在 所 有 的 案例 或 者 我 们 可 以 想到 的 更 多 的 案例 中 ,都 需要 收集 .整理 、 
汇总 和 解释 数据 。 在 本 书 的 描述 性 统计 部 分 你 可 以 学 到 收集 .整理 和 汇总 
数据 。 而 在 了 解 了 推论 性 统计 的 用 途 之 后 就 可 以 学 会 解释 数据 。 


什么 是 描述 统计 


描述 统计 (descriptive statistics) 常用 于 整理 、 描 述 所 收集 数据 的 特征 。 
所 收集 的 资料 有 时 也 称 作 数据 集 ( data set) 或 者 就 叫 数据 ( data) 。 

例如 ,下 面 所 列 出 的 就 是 22 名 大 学 生 的 姓名 、 主 修 专 业 和 年 龄 。 如 果 
需要 描述 大 学 最 流行 的 专业 是 什么 ,你 可 以 使 用 描述 统计 来 概括 他 们 的 选 
择 ( 也 称 作 众 数 ) 。 在 这 个 例子 中 最 大 众 化 的 专业 是 心理 学 。 如 果 你 想 知 
道学 生 的 平均 年 龄 ,可 以 很 容易 的 计算 另 一 个 描述 统计 值 ( 也 叫做 均值 ) 
来 确定 这 个 变量 。 这 两 个 简单 的 描述 统计 值 常 用 于 描述 数据 。 就 如 我 们 
对 下 面 22 个 案例 的 分 析 一 样 ,描述 统计 使 我 们 能 很 好 地 描述 大 的 数据 集 





的 特征 。 
姓名 专业 年 龄 姓名 专业 ER 
Richard 教育 学 19 Elizabeth 英语 21 
Sara 心理 学 18 Bill 心理 学 22 
Andrea 教育 学 19 Hadley 心理 学 23 
Steven 心理 学 21 Buffy 教育 学 21 
Jordan 教育 学 20 Chip 教育 学 19 
Pam 教育 学 24 Homer 心理 学 18 
Michael 心理 学 21 Margaret 英语 22 
Liz 心理 学 19 Courtney 心理 学 24 
Nicole 化 学 19 Leonard 心理 学 21 
Міке 护理 学 20 Jeffrey 化 学 18 
Kent 历史 18 Emily 西班牙 语 19 


你 瞧 , 这 是 多 么 简单 ! 要 确定 最 常 被 选择 的 专业 ,就 是 要 确定 哪 一 个 
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专业 出 现 次 数 最 多 。 要 确定 平均 年 龄 ,就 是 将 所 有 的 年 龄 值 加 起 来 然后 除 








以 22。 你 是 对 的 出 现 次 数 最 多 的 专业 是 心理 学 (9 次 ) ,平均 年 龄 是 
20.3。 瞧 , 没 人 插手 一 一 你 就 是 统计 分 析 师 。 
什么 是 推论 统计 


推论 统计 (inferential statistics ) 通常 是 (但 并 非 总 是 ) 数 据 收 集 和 汇总 
后 的 下 一 步 。 推 论 统 计 常 利用 较 小 群体 的 数据 (如 我 们 的 22 个 学 生 构 成 
的 群体 ) 来 推论 可 能 的 较 大 群体 (如 艺术 和 科学 院 的 所 有 学 生 ) 的 特征 。 

这 个 较 小 的 群体 通常 叫做 样本 (sample) ,是 总 体 (population ) 的 一 部 
分 或 一 个 子 集 。 例 如 ,新 泽 西 州 纽 瓦 克 的 所 有 五 年 级 学 生 构 成 一 个 总 体 
(所 有 具备 这 些 特征 一 一 正好 是 五 年 级 而 且 住 在 纽 瓦 克 一 一 的 人 都 包括 
在 内 ) ,从 中 选取 150 人 就 构成 一 个 样本 。 

咱们 来 看 另外 一 个 例子 。 作 为 新 雇用 的 研究 人 员 ,你 的 市 场 代 理 要 你 
确定 多 个 名 称 中 的 哪 一 个 最 适合 作 暮 片 的 新 品牌 ,是 暮 片 王 ,乐趣 暮 片 ,还 
是 嚼 嚼 乐 ? 作为 专业 统计 分 析 人 员 ( 我 知道 我 们 现在 超前 了 一 点 ,但 是 保 
持 信 念 ) ,你 需要 选取 一 个 薯 片 食用 者 小 群体 ,这 个 群体 可 以 代表 所 有 的 
喜欢 吃 薯 片 的 人 ,接着 询问 这 个 群体 让 他 们 告诉 你 最 喜欢 这 三 个 名 称 中 的 
哪 一 个 。 如 果 你 做 得 很 好 ,就 可 以 很 容易 地 将 这 个 发 现 推论 到 更 大 的 暮 片 
食用 者 群体 中 。 

或 者 ,如果 说 你 对 某 种 疾病 的 最 佳 治 疗 方案 感 兴趣 。 你 可 以 让 一 组 试 
用 一 种 新 药 , 男 一 组 食用 安慰 剂 (或 者 大 家 知道 的 没有 任何 效果 的 其 他 丸 
剂 ) ,第 三 组 什么 药 也 不 吃 , 然 后 来 看 结果 是 什么 。 好 吧 ,你 会 发 现 大 多 数 
病人 在 没有 接受 任何 治疗 情况 下 会 好 转 , 而 且 机 体 自身 会 恢复 ! 药物 没有 
任何 效果 。 那 么 依据 你 的 实验 结果 ,你 可 以 将 这 些 信息 推论 到 更 大 的 遭受 
这 种 疾病 痛苦 的 病人 群体 。 


统计 学 是 帮助 我 们 理解 周围 世界 的 工具 。 这 是 通过 整理 我 们 收集 到 
的 数据 实现 的 ,而 且 接 着 还 可 以 让 我 们 做 出 特定 的 推断 ,也 就 是 怎样 将 那 
些 数 据 的 特征 应 用 到 新 的 情况 。 描 述 统 计 和 推论 统计 可 以 一 起 发 挥 作用 ， 
使 用 哪 一 种 、 何 时 使 用 取决 于 你 想 要 回答 的 问题 。 


我 在 统计 学 课堂 上 做 什么 


你 选择 使 用 这 本 书 可 能 有 多 种 原因 。 也 许 是 选修 了 统计 学 导论 课程 ， 
或 者 是 在 申请 综合 考试 ,其 至 是 在 暑假 预习 这 本 书 ( 怒 怖 !) ,并 且 想 申请 
更 高 级 的 课程 。 

总 之 你 都 是 学 习 统 计 学 的 学 生 ,不论 你 是 否 参 加 课程 结束 后 的 考试 ， 
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或 者 只 是 为 了 自己 的 目的 选择 这 门 课程 。 但 是 学 习 这 门 课 有 许多 好 的 理 
由 它 很 有 趣 , 它 很 重要 ,或 者 同时 具备 两 者 。 下 面 是 我 的 学 生 在 我 们 
的 统计 学 导论 课程 开始 之 初 听 到 的 一 些 说 法 。 

1. 统计 学 101 或 统计 学 1 或 者 是 你 们 学 校 用 的 任何 其 他 课程 名 称 , 在 你 
的 成 绩 单 中 看 起 来 很 重要 。 说 真 的 ,统计 学 是 你 完成 你 的 专业 的 必修 课程 。 
即使 不 是 ,拥有 统计 学 技能 绝对 是 到 时 候 找 工作 或 进一步 学 习 的 重要 附加 
值 。 而 且 如 果 选 修了 更 高 级 的 课程 ,你 的 简历 肯定 会 更 令 人 印象 深刻 。 

2. 如 果 不 是 必修 课程 ,选修 基础 统计 学 可 以 把 你 和 没有 选修 的 同学 区 
别 开 来 。 这 表明 你 愿意 选择 难度 和 投入 程度 在 平均 水 平 以 上 的 课程 。 

3. 基础 统计 学 可 能 是 你 不 熟悉 的 一 种 智力 挑战 。 这 个 过 程 需要 考虑 很 
多 事情 ,一些 数 学 计算 ,一 些 想法 和 应 用 的 结合 。 最 起 码 , 把 所 有 活动 加 起 
来 看 就 是 一 次 充满 活力 的 智力 体验 ,因为 你 要 学 习 的 是 全 新 的 领域 和 学 科 。 

4. 毫 无 疑问 ,如果 具 备 一 定 的 统计 学 背景 ,你 会 成 为 社会 科学 或 行为 
科学 的 更 好 的 学 生 , 因 为 你 可 以 更 好 地 理解 杂志 中 的 文章 ,也 可 以 更 好 地 
理解 老师 和 同伴 在 课堂 内 或 课堂 外 讨论 的 内 容 或 所 做 的 研究 。 你 可 能 很 
惊讶 你 第 一 次 对 自己 说 ,“ 哇 ,我 真 的 听 懂 了 他 们 在 讨论 什么 ”。 而 且 这 会 
经 常 发 生 , 因 为 你 已 经 具备 了 正确 地 理解 科学 家 如 何 得 出 结论 所 必 备 的 基 
本 工具 。 

5. 如 果 你 计划 获得 教育 学 、 人 类 学 经 济 学 、 护 理学 、 社 会 学 或 其 他 社 
会 ,行为 或 生物 科学 领域 的 任何 一 个 学 科 的 硕士 学 位 ,统计 学 课程 是 你 前 
进 的 基础 。 

6. 最 后 ,你 可 以 夸 口 说 你 完成 了 人 人 都 认为 是 相当 于 建立 和 运行 核 反 
应 堆 的 高 难度 课程 。 


使 用 这 本 书 的 十 种 方式 (同时 也 在 学 统计 学 !) 


耶 , 刚 好 是 需要 的 统计 学 书 。 但 是 这 一 本 是 不 同 的 。 这 本 书 是 针对 学 
生 写 的 ,但 不 是 降低 标准 ,而 是 信息 充分 ,也 尽 可 能 展现 基础 内 容 。 本 书 也 
没有 假定 在 课程 开始 之 前 应 该 具备 什么 知识 ,只 是 进程 安排 较 缓 、 步 骤 较 
小 ,可 以 让 学 生 按 自己 的 节奏 安排 。 

大 家 都 认为 统计 学 是 很 难 掌握 的 课程 。 的 确 我 们 也 这 么 认为 ,因为 统 
计 学 的 一 部 分 的 确 充满 挑战 。 另 一 方面 ,无 数 的 学 生 已 经 掌握 了 这 门 课程 ， 
你 也 可 以 。 在 开始 我 们 的 第 一 个 主题 之 前 , 先 看 一 下 导论 这 一 章 的 要 点 。 

1. 你 不 笨 。 这 是 真 的 。 如 果 你 是 笨蛋 ,你 不 可 能 在 学 业 方 面 走 这 么 
远 。 因 此 ,对 待 统计 学 就 像 对 待 其 他 新 的 课程 那样 吧 。 听 讲座 ,学 习 基 本 
内 容 , 做 书 上 的 练习 或 课堂 练习 ,那么 你 就 会 学 得 很 好 。 火 科研 究 者 精通 
统计 学 ,不 过 你 不 需要 像 火箭 研究 者 那样 研究 统计 学 。 

2. 你 怎么 知道 统计 学 很 难 学 ? 统计 学 很 难 学 ? 既是 也 不 是 。 如 果 你 
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是 从 上 过 这 门 课 的 朋友 那儿 听 来 的 ,而 他 们 没有 努力 学 习 也 没有 学 好 , 那 
么 肯定 愿意 告诉 你 统计 学 是 多 么 难 学 ,甚至 会 说 ,统计 学 即使 不 是 对 整个 
生活 的 灾难 ,对 整个 学 期 来 说 也 是 灾难 。 不 过 我 们 不 要 忘记 一 一 我 们 总 是 
倾听 抱怨 者 的 抱怨 。 因 此 ,我 们 建议 你 应 该 以 这 种 态度 开始 这 门 课 程 ,也 
就 是 ,等 着 看 统计 学 是 否 难 学 ,并 且 依据 自己 的 经 验 做 出 判断 。 更 好 的 选 
择 是 找 几 个 上 过 这 门 课 的 人 讨论 一 下 ,获得 他 们 的 总 的 看 法 。 不 要 依据 让 
人 泄气 的 人 的 经 验 做 出 判断 。 

З. 不 要 逃课 一 一 按 顺 序 学 习 各 章 的 内 容 。《 爱 上 统计 学 》 的 每 一 章 都 
是 下 一 章 的 基础 。 我 希望 在 课堂 上 学 习 了 所 有 内 容 后 ,你 就 可 以 回顾 整 本 
书 ,并 把 这 本 书 作为 参考 书 。 如 果 你 需要 确定 表 中 的 特定 值 , 可 以 查阅 附 
录 B。 或 者 ,你 需要 记 起 如 何 计 算 标准 差 , 可 以 回顾 第 三 章 的 内 容 。 但 是 
现在 要 按照 本 书 的 顺序 学 习 每 一 章 。 当 然 也 可 以 不 按照 顺序 , 先 了 解 后 面 
的 学 习 内 容 。 但 是 在 学 习 后 面 章节 之 前 要 掌握 前 面 的 章节 。 

4. 形成 学 习 小 组 。 这 是 确保 通过 这 门 课程 的 最 基本 的 方式 之 一 。 在 
一 个 学 期 的 开始 ,要 和 朋友 商定 一 起 学 习 。 如 果 没 有 朋友 选择 同一 课程 ， 
那么 就 要 结交 新 朋友 ,或 者 邀请 和 你 一 样 看 起 来 很 高 兴学 习 统 计 学 的 学 生 
一 起 学 习 。 如 果 你 学 得 比 他 人 好 ,一 起 学 习 可 以 帮助 他 人 ,反之 ,他 人 学 得 
比 你 好 你 就 可 以 从 他 人 那里 受益 。 每 个 星期 安排 特定 的 时 间 聚 在 一 起 一 
个 小 时 ,复习 每 一 章 后 的 练习 题 ,或 者 相互 提问 。 或 者 依据 需要 安排 更 多 
时 间 。 与 他 人 一 起 学 习 是 帮助 你 理解 和 掌握 课程 内 容 的 有 用 的 方式 。 

5. 向 老师 提问 或 者 向 朋友 提问 。 如 果 你 不 了 解 课堂 上 所 讲授 的 内 容 ， 
可 以 向 老师 提问 辨 明 问 题 。 毫 无 疑问 一 一 如 果 你 不 理解 课程 内 容 ,那么 这 
很 可 能 是 很 多 人 共同 的 问题 。 老 师 一 般 都 欢迎 提问 。 特 别 是 如 果 你 上 课 
前 已 经 预习 ,你 的 问题 就 包含 更 多 信息 ,可 以 帮助 其 他 学 生 更 好 地 理解 课 
程 内 容 。 

6. 完成 章 后 练习 题 。 练 习题 是 以 每 一 章 的 内 容 和 案例 为 基础 的 。 这 
些 练习 题 可 以 帮助 你 运用 每 一 章 讲 授 的 概念 ,同时 可 以 建立 自信 心 。 这 些 
练习 题 如 何 发 挥 作用 ? 如 何 解 答 每 一 个 练习 题 对 应 着 的 那 一 个 问题 。 如 
果 可 以 解答 章 后 的 练习 题 ,那么 你 已 经 很 好 地 掌握 了 这 一 章 的 内 容 。 

7. 练习 ,练习 ,再 练习 。 是 的 ,这 是 个 很 古老 的 笑话 。 

问 :如 何 才 能 到 卡 内 基 大 厅 *? 

答 : 练 习 , 练 习 , 再 练习 。 

好 吧 ,这 和 基础 统计 学 没有 区 别 。 你 必须 应 用 学 到 的 知识 ,而 且 通 过 
经 常 应 用 来 掌握 不 同 的 方法 和 技术 。 这 意味 着 解答 1 ~ 16 章 的 练习 题 .好 
好 利用 遇 到 的 任何 机 会 帮助 理解 学 到 的 内 容 。 | 

8. 寻找 应 用 实例 使 得 所 学 内 容 更 现实 。 在 其 他 课 上 ,你 可 能 有 机 会 读 





* 美国 有 名 的 音乐 演奏 厅 , 只 有 达到 相当 高 演奏 水 平 的 音乐 人 士 才 有 资格 在 那里 登台 。 这 里 的 问 句 本 来 是 
问 路 。 一 一 译 者 注 
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AZADE да 


到 杂志 上 发 表 的 文章 ,讨论 研究 的 结论 ,并 且 对 你 的 学 习 领 域 的 科学 研究 
方法 的 重要 性 进行 一 般 的 讨论 。 这 些 都 是 机 会 ,可 以 考察 所 学 的 统计 学 如 


何 帮助 你 更 好 地 理解 课堂 讨论 的 主题 和 应 用 统计 学 的 领域 。 这 个 想法 实 


践 得 越 多 ,你 的 理解 就 越 好 、 越 充分 。 

9. 浏览 。 首 先 阅 读 指 定 的 章节 ,然后 返回 来 带 着 目的 阅读 。 要 选择 轻 
松 地 学 习 《 爱 上 统计 学 》 的 道路 ,然后 考察 每 一 章 包 含 的 内 容 。 不 要 双人 迫 
自己 。 了 解 将 要 学 习 的 主题 的 同时 熟悉 现在 的 课堂 内 容 总 会 有 好 处 。 

10. 得 到 乐趣 。 这 听 起 来 好 像 很 奇怪 。 但 是 总 的 来 说 ,与 其 让 这 门 课 
和 人 它 的 要 求 掌握 你 不 如 你 掌握 这 门 课 。 建 立 学 习 计 划 并 按 计划 完成 ,在 课 
咎 上 提问 题 ,而 且 将 智力 实践 看 作 是 成 长 的 一 种 形式 。 掌 握 新 知识 总 是 令 
人 激动 和 满足 一 一 这 是 人 类 活力 的 体现 。 在 这 里 你 也 可 以 体验 这 种 满足 
感 一 一 集中 精力 、 做 出 必要 的 保持 功课 水 平 的 承诺 并 且 努 力学 习 。 


关于 那些 符号 


2 








= 
Ху” 


一 个 符号 是 一 种 象征 。 浏 览 4 爱 上 统计 学 》 全 书 你 会 发 现 有 许 
多 不 同 的 符号 。 下 面 是 每 一 个 符号 以 及 所 代表 的 意义 。 


a 


/ 这 个 符号 表示 正文 之 外 的 信息 。 我 们 发 现 有 必要 详细 说 明 特 
定 的 观点 ,而且 我 们 能 够 很 容易 地 在 常规 资料 之 外 做 到 这 一 点 。 


我 们 可 以 选择 一 些 更 专业 的 观点 ,然后 简要 地 讨论 并 告诉 你 
哪些 内 容 超过 课程 的 范围 。 你 会 发 现 这 很 有 意思 ,也 很 有 用 。 


浏览 4 爱 上 统计 学 》 全 书 你 会 发 现 许多 小 梯子 符号 ,就 像 在 这 
儿 看 到 的 。 这 表明 这 里 有 许多 步骤 , 沿 着 这 些 步骤 可 以 指导 你 通 
过 特定 的 过 程 。 这 些 步 又 已 通过 检验 ,也 被 任何 一 个 证 明 这 些 步 
又 的 机 构 证 明 。 


绑 着 蝴蝶 结 的 手指 是 很 可 爱 的 符号 ,但 它 的 主要 目的 是 用 于 
强调 你 所 读 到 主题 的 重点 。 在 学 习 过 程 中 ,强调 这 些 重点 是 由 于 
这 些 重点 通常 是 这 个 主题 的 关键 。 


《 爱 上 统计 学 》 的 大 多 数 章节 提供 了 一 个 或 多 个 特殊 的 统计 过 
程 和 同步 计算 的 详细 信息 。 计 算 机 符号 用 于 表明 每 章 “ 使 用 计算 
机 …” 的 部 分 。 
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本 书 的 许多 章节 都 包含 如 何 使 用 5Р5511.5 版 本 来 完成 同样 的 统计 过 
程 的 指导 ,因此 你 可 以 手动 计算 ,也 可 以 应 用 现在 的 任何 一 款 非常 有 效 的 
统计 分 析 软 件 包 来 计算 。 

附录 A 是 对 SPSS 的 介绍 。 若 准备 使 用 SPSS , 通 览 这 个 附录 是 现在 要 
完成 的 任务 。 如 果 你 有 更 早 的 SPSS 版 本 (或 者 是 Max 版 本 ) ,这 些 资料 仍 
然 非常 有 用 。 实 际 上 最 近 的 SPSS 视窗 版 本 和 Max 版 本 在 形式 和 功能 方 
面 几 乎 一 致 。 

可 以 使 用 附录 C 的 数据 集 来 完成 本 书 练 习题 。 每 到 一 章 的 “使 用 计 
算 机 … ”部 分 ,就 会 发 现 数据 集 的 索引 (例如 “第 二 章 数 据 集 1” ) 。 每 一 个 
数据 集 都 在 附录 C, 如 果 你 按部就班 地 学 习 本 课程 就 可 以 使 用 这 些 数 据 来 
成 功 地 完成 “使 用 计算 机 …” 部分。 可 以 手动 建立 数据 库 , 也 可 以 从 本 书 
的 网 址 http://www. sagepub. com/statbook/datasets 下 载 数 据 。 只 要 点 击 
Data Sets 然后 保存 就 可 以 。 或 者 从 作者 自己 在 堪萨斯 大 学 的 网 址 下 载 数 
据 集 ( http://www. soeku. edu/faculty/salkind/stats_fpwhs/)。 点 击 Statistics 
for People… 进 入 这 本 书 的 主页 ,然后 下 载 SPSS 文件 。 

从 Sage 的 主页 和 本 书 的 主页 也 可 以 下 载 Excel 格式 的 数据 集 。 


难度 指数 
1 非常 难 © 
2 比较 难 @@ 
3 一 般 OOO 
4 比较 容易 OOOO 
5 非常 容易 OOOO 
小 Ж 


实际 情况 不 是 那么 糟 , 对 吧 ? 我 们 想 要 鼓励 大 家 继续 学 习 , 并 且 不 要 
担心 难 易 程度 和 时 间 花 费 ,也 不 要 担心 由 于 太 复 杂 而 不 能 理解 和 应 用 。 每 
次 只 学 一 章 ,就 像 现 在 所 做 的 。 


练习 时 间 


因为 没有 真实 事物 的 替代 物 ,1 ~ 16 章 的 结尾 都 是 习题 集 ,这 些 习题 
可 以 帮助 你 回顾 每 一 章 覆 盖 的 内 容 。 而 且 也 不 需要 到 处 找 答案 ,因为 这 些 
习题 的 答案 也 可 以 在 每 一 章 的 最 后 部 分 找到 。 

下 面 就 是 第 一 个 习题 集 。 

1. 访问 一 个 日 常 工作 中 应 用 统计 学 的 人 。 这 个 人 可 能 是 你 的 顾问 、 指 
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导 教 师 、 生 活 在 同一 街区 的 研究 者 、 公 司 的 市 场 分 析 人 员 或 城市 规划 人 员 。 
询问 他 或 她 最 喜欢 的 统计 课程 。 探 寻 他 或 她 喜欢 什么 不 喜欢 什么 。 他 或 
她 是 否 给 你 一 些 有 助 于 成 功 的 建议 。 而 且 最 重要 的 是 ,询问 他 或 她 在 工作 
中 使 用 这 一 对 你 来 说 是 全 新 的 工具 (统计 学 ) 的 方式 。 

2. 查阅 本 地 报纸 , 找 出 任何 主题 的 调查 和 访谈 的 结论 。 总 结 这 些 结 
论 ,然后 以 你 的 能 力 尽 可 能 地 描述 相关 的 研究 人 员 或 者 调查 人 员 如 何 得 出 
他 们 的 结论 。 这 个 过 程 可 能 容易 也 可 能 不 容易 。 一 旦 你 了 解 了 他 们 这 样 
做 的 原因 ,尽力 推测 其 他 的 收集 、 整 理 和 汇总 同样 数据 的 方法 。 

3. 去 图 书馆 复印 一 些 你 的 专业 领域 的 文章 。 然 后 浏览 有 形象 符号 标 
示 之 一 的 文章 ,而 且 重 点 关注 用 于 整理 和 分 析 数 据 的 统计 过 程 部 分 (通常 
是 “结果 ”部 分 )。 你 可 能 对 具体 的 统计 过 程 了 解 不 多 ,但 是 你 能 识别 多 少 
不 同 的 统计 过 程 ( 如 上 检验 ,均值 和 标准 差 的 计算 ) ? 你 是 否 能 完成 下 一 步 
的 工作 ? 并 且 告 诉 你 的 老师 这 些 结 果 和 研究 问题 的 关系 ,或 者 与 最 初 的 研 
究 课 题 的 关系 。 

4. 在 网 上 查找 四 个 包含 任何 主题 数据 的 网 址 ,然后 简要 介绍 所 提供 的 
数据 类 型 以 及 数据 是 如 何 整 理 的 。 例 如 ,登陆 数据 网 址 的 源头 一 一 美国 人 
口 统计 局 (http://www. census. роу) ,你 会 发 现 “Access Tools” 链接 ,进入 
后 的 网 页 提供 真实 数据 的 链接 。 尽 力 查找 适合 你 的 专业 的 数据 和 资料 。 


第 [部 分 
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精神 分 析 学 的 奠基 人 西格玛 ， 弗 洛 伊 德 (Sigmund Freud) * 做 得 很 好 的 一 件 
事 就 是 观察 和 描述 他 的 病人 的 状况 。 他 是 机 敏 的 观察 者 ,应 用 他 的 技能 发 展 了 
第 一 个 系统 而 综合 的 人 格 理论 。 不 论 你 对 他 的 观点 的 有 效 性 有 什么 看 法 ,他 都 
是 一 个 优秀 的 科学 家 。 

回 到 20 世纪 早期 ,统计 学 课程 (就 如 你 所 选 的 统计 课程 ) 不 是 大 学 生 或 研究 
生 课 程 表 中 的 必修 课 。 统 计 学 还 是 相当 新 的 领域 ,而 且 科 学 探索 的 精神 不 需要 
统计 工具 带 入 科学 领域 的 精确 性 。 

但 是 事情 已 经 发 生 改变 。 现 在 几乎 在 任何 领域 ,数字 都 很 重要 。《 爱 上 统计 
学 》 的 这 部 分 主要 致力 于 了 解 ,在 整理 了 结果 数据 之 后 ,如 何 应 用 统计 学 描述 结 
果 并 更 好 地 理解 结果 。 

第 2 章 讨 论 集中 趋势 的 测量 , 以 及 如 何 计 算 多 种 平均 数 中 的 一 种 以 便 最 好 
地 代表 一 组 数据 。 第 3 章 全 面 介绍 用 于 描述 一 系列 数据 点 的 离散 性 的 工具 , 包 
括 标 准 差 和 方差 。 到 了 第 4 章 就 要 准备 学 习 如 何 描述 不 同 的 数据 分 布 或 不 同 的 
数据 集 之 间 的 差异 ,以 及 这 种 差异 的 意义 。 第 5 章 处 理 变 量 之 间 的 关系 ,也 就 是 
相关 关系 。 

完成 第 古 部 分 之 后 ,你 已 经 站 在 了 很 好 的 起 点 上 ,可 以 开始 理解 概率 和 推论 
在 社会 科学 和 行为 科学 中 扮演 的 角色 。 


ж Sigmund Freud ,一 般 应 译 为 西 格 蒙 德 ， 弗 洛 伊 德 。 此 处 作者 为 了 使 语言 更 该 谐 有 趣 ,所 以 采用 了 ”二 " 符 
号 来 代替 Sig ,故我 们 此 处 将 其 译 为 “西格玛 " 。 一 一 译 者 注 


АУА ИД) 
一 一 计算 和 理解 平均 数 








本 章 你 会 学 到 什么 


° 了解 集中 趋势 量 数 

o 计算 一 组 数据 的 均值 

° 计算 一 组 数据 的 众 数 和 中 位 数 
° 选择 一 种 集中 趋势 量 数 


你 已 经 很 有 耐心 了 ,那么 现在 就 开始 处 理 真 实 、 生 动 的 数据 。 这 也 正 
是 你 在 这 一 章 要 做 的 。 一 旦 收集 了 数据 ,第 一 步 通 常 是 整理 数据 ,也 就 是 
使 用 简单 的 指标 来 描述 数据 。 完 成 这 一 步 的 最 容易 的 方法 就 是 计算 几 种 
不 同形 式 的 平均 数 。 | 

平均 数 (average) 是 能 够 最 好 地 代表 一 组 数据 的 数值 。 数 据 组 是 30 
个 五 年 级 学 生 的 拼写 测验 的 正确 个 数 ,还 是 纽约 洋基 队 的 击 打率 ,或 者 是 
最 近 的 选举 中 登记 为 民主 党 或 共和 党 的 人 数 , 这 不 重要 。 在 所 有 的 案例 中 
数据 组 都 可 以 使 用 平均 数 来 概括 。 平 均 数 也 叫做 集中 趋势 量 数 ( measures 
of central tendency) ,一 般 有 三 种 形式 :均值 .中 位 数 和 众 数 。 每 一 种 形式 
提供 不 同 的 数据 分 布 信 息 ,而 且 计 算 和 解释 都 很 简单 。 


计算 均值 


均值 (mean) 是 计算 平均 数 最 常用 的 形式 。 均 值 很 简单 ,就 是 数据 组 
中 所 有 数值 的 总 和 除 以 该 组 数值 的 个 数 。 因 此 如 果 你 有 30 个 五 年 级 学 生 
的 拼写 成 绩 ,将 所 有 的 拼写 成 绩 简 单 地 加 起 来 就 得 到 一 个 总 和 ,然后 除 以 
学 生 的 人 数 , 也 就 是 30。 

公式 2. 1 就 是 均值 计算 公式 。 


Х = а (2, 19 


n 





其 中 
。 上 人 带 横 线 的 字母 X( 读 做 "和 把 ” ) 是 数据 组 的 平均 数 或 均值 。 
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° 5 或 希腊 字母 西格玛 是 连 加 符号 ,也 就 是 将 其 后 的 所 有 数值 都 加 
起 来 。 

e 工 是 数据 组 中 每 个 具体 的 数值 。 

。 最 后 ,n 是 从 中 计算 均值 的 样本 的 规模 。 


下 面 是 计算 均值 的 步骤: 

1 一 以 一 列 或 多 列 的 形式 列 出 所 有 数值 。 这 些 数值 就 是 那些 X。 
2 一 计算 所 有 数值 的 总 和 或 总 计 。 

3 一 总 和 或 总 计 除 以 数值 的 个 数 。 





例如 ,你 需要 计算 三 个 不 同 场所 的 消费 者 的 数量 的 平均 数 ,你 可 以 计 


算 均 值得 到 这 个 值 。 
场所 年 顾客 数量 
兰 哈 姆 公园 商店 2 150 
威廉 斯 堡 商店 1 534 
下 城 商 店 3 564 


每 个 商店 顾客 数量 的 平均 数 或 均值 是 2 416. AR 2.2 表明 如 何 应 用 
公式 2.1 计算 这 个 值 。 瞧 ,我 已 经 告诉 你 很 容易 了 。 小 菜 一 碟 ! 
y = ÈX _ 2 150 + 1 534 +3 564 


WW E 2 416 (2.2) 


需要 记忆 的 内 容 


均值 有 时 也 用 字母 M 表示 ,也 叫做 典型 平均 数 或 中 心 值 。 如 
i 果 你 在 看 其 他 的 统计 学 书 或 者 研究 报告 ,就 会 看 到 类 似 M = 45. 87 
9 L. 这 样 的 表达 式 , 这 就 可 能 意味 着 均值 等 于 45. 87。 
| К ө 在 上 面 的 公式 中 小 写字 母 n 表示 从 中 计算 均值 的 样本 的 规模 。 
大 写字 母 N( 像 这 样 的 ) 表 示 总 体 规模 。 在 一 些 书 中 和 一 些 杂 志 
的 文章 中 没有 对 这 两 者 做 出 区 别 。 
e° 样本 均值 是 非常 准确 地 反映 总 体 均 值 的 集中 趋势 量 数 。 
° 均值 就 像 跷 跷 板 上 的 支点 。 均 值 就 是 中 心 点 ,也 就 是 均值 一 边 
的 所 有 数值 等 于 均值 另 一 边 的 所 有 数值 。 
。 最 后 ,不 论 好 坏 ,均值 对 极 值 很 敏感 。 极 值 会 使 得 均值 向 一 方 或 
另 一 方 倾斜 ,也 使 得 均值 对 数据 组 的 代表 性 减弱 ,同时 作为 集中 
趋势 量 数 的 有 效 性 减弱 。 当 然 这 依赖 于 计算 均值 的 数值 。 后 面 
会 有 更 多 的 讨论 。 
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“A 均值 也 是 指 算术 平均 数 (arithmetic mean) , 当然 你 也 会 看 到 其 
-OA 他 类 型 的 均值 ,如 调和 均值 。 调 和 均值 用 于 特殊 的 情况 ,你 现在 不 
() 需要 关注 。 如 果 你 想 表现 得 更 专业 ,算术 平均 数 ( 也 就 是 我 们 讨论 

到 现在 的 均值 ) 定 义 的 基点 是 均值 的 偏差 的 总 和 是 О С 1001) 。 例 如 

你 有 三 个 值 3,4 和 5 (均值 是 4) ,均值 的 偏差 ( -1.0 和 1) 的 总 和 


是 0。 





计算 加 权 平 均 数 


以 上 的 案例 是 如 何 计算 简单 的 均值 。 但 是 有 的 情况 下 同样 的 数值 不 
止 出 现 一 次 ,这 就 需要 计算 加 权 平 均 数 。 加 权 平 均 数 可 以 很 容易 地 计算 ， 
也 就 是 每 一 数值 乘 以 它 出 现 的 频数 ,并 将 所 有 的 积 相 加 ,然后 除 以 频数 的 
总 和 。 





按照 下 面 的 步骤 计算 加 权 平 均 数 : 

1 一 列 出 要 计算 均值 的 样本 的 所 有 数值 ,如 下 表 中 标签 为 “数值 ”的 
列 中 的 所 有 数值 (X 的 值 ) 。 

2 一 列 出 每 一 个 数值 出 现 的 频数 。 

3 一 每 一 数值 乘 以 它 的 频数 ,如 表 中 第 三 列 所 示 。 

4 一 计算 “数值 x 频数 " 列 的 所 有 数值 总 和 。 

5 一 除 以 频数 的 总 和 。 








例如 ,这 个 表格 整理 的 数据 是 100 个 飞行 员 飞 行 效率 测验 的 数值 和 





频数 。 
数值 频数 数值 x 频数 
97 4 388 
94 11 1 034 
92 12 1 104 
91 21 1 911 
90 30 2 700 
89 12 1 068 
78 9 702 
60( 不 要 和 这 个 家 伙 一 起 飞行 ) 1 60 
总 计 100 8 967 


一 
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加 权 平 均 数 是 8 967/100, 8% 89. 67。 以 这 种 方式 计算 均值 相对 于 将 
100 个 不 同 的 值 输入 计算 器 或 者 计算 机 软件 要 容易 得 多 。 


Ж. 在 基础 统计 学 部 分 要 做 的 一 个 重要 区 别 是 样本 (总 体 的 一 部 
> 分 ) 值 和 总 体 值 。 统 计 分 析 师 依据 下 面 的 方式 进行 区 别 。 样 本 统 
() 计 值 (例如 样本 均值 ) 使 用 罗马 字母 ;总 体 参 数值 (例如 总 体 均值 ) 
使 用 希腊 字母 。 因 此 100 个 五 年 级 学 生 的 拼写 成 绩 的 均值 表示 为 


X, ,而 所 有 五 年 级 学 生 的 拼写 成 绩 的 均值 表示 为 心 ,使 用 的 是 希腊 
字母 ти IÈ uo 








计算 中 位 数 


中 位 数 也 是 平均 数 ,但 是 是 非常 不 同 的 形式 。 中 位 数 ( median) 被 定 
义 为 一 系列 数据 的 中 点 。 在 这 一 数据 点 所 有 数据 的 一 半 也 就 是 50% 在 其 
之 上 而 另 一 半 或 者 说 50% 在 其 之 下 。 中 位 数 有 一 些 特别 的 性 质 ,我 们 会 
在 这 一 节 后 面 的 部 分 讨论 ,现在 集中 精力 考虑 如 何 计算 。 计 算 中 位 数 没有 
标准 公式 。 





下 面 是 计算 中 位 数 的 步骤 : 
1 一 以 从 大 到 小 或 者 从 小 到 大 的 顺序 列 出 数值 。 
2 一 找到 位 于 中 间 位 置 的 数值 。 那 就 是 中 位 数 。 








例如 ,下 面 是 5 个 家 庭 的 收入 。 

135 456 美元 

25 500 美元 

32 456 美元 

54 365 美元 

37 668 美元 

下 面 是 将 收入 从 大 到 小 排序 后 的 清单 。 

135 456 美元 

54 365 美元 

37 668 美元 

32 456 美元 

25 500 美元 

一 共 是 5 个 数值 。 中 间 位 置 的 数值 是 37 668 美元 ,也 就 是 中 位 数 。 

现在 ,如 果 数 值 的 个 数 是 偶数 怎么 计算 ? 我 们 在 收入 清单 中 增加 一 个 
数值 (34 500 美元 ) ,那么 就 有 6 个 收入 数值 。 如 下 所 示 。 
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135 456 美元 

54 365 美元 

37 668 美元 

34 500 美元 

32 456 美元 

25 500 美元 

如 果 数 值 个 数 是 偶数 ,中 位 数 就 是 中 间 两 个 数值 的 平均 数 。 在 这 个 案 
例 中 中 间 的 两 个 数值 是 34 500 美元 和 37 668 美元 。 这 两 个 数值 的 平均 数 
Jë 36 084 美元 。 这 就 是 6 个 数值 的 数据 集 的 中 位 数 。 

如 果 中 间 的 两 个 数值 相同 怎么 计算 ,就 如 下 面 的 数据 集 ? 

45 678 美元 

25 567 美元 

25 567 美元 

13 234 美元 

那么 中 位 数 和 中 间 的 两 个 数值 相同 。 在 这 个 案例 中 中 位 数 是 25 567 
美元 。 


如 果 你 了 解 中 位 数 ,也 应 该 知道 百 分 位 点 (percentile points) 。 
:05 百 分 位 点 用 于 定义 数据 集 或 数据 分 布 中 等 于 或 者 小 于 一 个 特定 数 
ak 据 值 的 个 体 的 百分数 。 例 如 ,你 的 成 绩 是 “处 在 75 百 分 位 点 ” ,这 
J> 意味 着 成 绩 分 布 中 你 的 成 绩 刚好 是 或 者 超过 75% 的 其 他 人 的 成 
绩 。 大 家 也 知道 中 位 数 是 50 百 分 位 点 ,因为 数据 分 布 中 50% 的 个 
体 在 这 一 点 之 下 。 其 他 的 百 分 位 点 也 很 有 用 ,如 25 百 分 位 点 , 通 
常用 О, 表述 ,75 百 分 位 点 ,通常 用 Q, 表示 。 那 么 О, 呢 ? 当然 是 

中 位 数 。 


现在 给 出 一 些 问题 的 答案 ,这 些 问题 可 能 在 开始 讨论 中 位 数 时 就 出 现 
在 你 的 头脑 中 了 。 为 什么 使 用 中 位 数 而 不 是 均值 ? 一 个 非常 好 的 原因 是 
中 位 数 对 极 值 不 敏感 而 均值 却 不 是 。 

如 果 你 的 数据 集中 有 一 个 或 多 个 极 值 ,中 位 数 相对 其 他 集中 趋势 量 数 
来 说 能 更 好 地 代表 数据 集 的 中 心 值 。 是 的 ,甚至 比 均值 更 好 。 

我 们 所 说 的 极 值 是 什么 ? 非常 容易 就 可 以 想到 ,一 个 极 值 就 是 与 其 所 
属 数据 组 非常 不 同 的 值 。 例 如 ,考虑 之 前 的 案例 中 已 经 用 过 的 收入 清单 ， 
在 这 里 再 次 列 出 : 

135 456 美元 

54 365 美元 

37 668 美元 

32 456 美元 

25 500 美元 
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这 组 数据 中 数值 135 456 美元 与 其 他 4 个 数值 之 间 的 差异 较 大 。 我 
们 可 以 认为 这 个 数值 就 是 极 值 。 

最 好 的 说 明 中 位 数 作为 集中 趋势 量 数 是 多 么 有 用 的 方法 是 计算 包含 
一 个 或 多 个 极 值 的 同一 数据 集 的 均值 和 中 位 数 , 然 后 比较 哪 一 个 值 能 更 好 
地 代表 数据 集 。 现 在 就 来 计算 和 比较 。 

上 面 有 5 个 收入 数值 的 数据 组 的 平均 数 或 均值 是 5 个 数值 的 总 和 除 
以 5 ,结果 是 57 089 美元 。 而 这 个 数据 组 的 中 位 数 是 37 668 美 元 。 哪 一 个 
值 能 更 好 地 代表 这 个 数据 组 ? 数值 37 668 美元 更 加 明显 地 位 于 数据 组 的 
中 间 ,但 是 我 们 习惯 于 认为 平均 数 具 有 代表 性 或 者 占据 中 间 位 置 。 事 实 
上 ,均值 57 089 美元 在 第 4 高 位 数值 (54 365 美元 ) 之 上 ,不 是 这 个 数据 分 
布 的 中 间 值 ,也 不 具有 代表 性 。 

就 是 由 于 这 个 原因 ,特定 的 社会 和 经 济 指标 (大 多 数 与 收入 相关 ) 的 
分 析 使 用 中 位 数 作为 集中 趋势 量 数 ,例如 “美国 家 庭 平 均 收 入 的 中 位 数 是 
ыру, ,而 不 是 使 用 均值 来 概括 收入 。 总 是 存在 太 多 的 极 值 改 变 或 者 明显 
地 扭曲 一 个 数据 组 或 者 数据 分 布 的 中 心 点 。 





需要 记忆 的 内 容 


这 些 有 关中 位 数 的 内 容 十 分 重要 也 很 有 趣 ,需要 记忆 。 
24 ° 均值 是 一 系列 数值 的 中 间 点 ,而 中 位 数 是 一 系列 个 体 的 中 间 点 。 
с 7 ° 因为 中 位 数 关 注 的 是 有 多 少 个 体 而 不 是 这 些 个 体 的 数值 , 极 值 ( 有 
时 也 叫做 奇异 值 ) 就 不 会 产生 影响 。 


计算 众 数 


我 们 要 学 习 的 第 三 个 也 是 最 后 一 个 集中 趋势 量 数 是 众 数 ,也 是 最 笼 
统 、 最 不 精确 的 集中 趋势 量 数 , 但 是 在 理解 特定 的 数据 集 的 特征 中 扮演 着 
非常 重要 的 角色 。 众 数 (mode) 就 是 出 现 次 数 最 多 的 数值 。 没 有 计算 众 数 
的 公式 。 
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按照 下 面 的 步骤 计算 众 数 : 

1 一 列 出 一 个 数据 分 布 中 的 所 有 数值 ,但 是 每 一 个 数值 只 列 出 
— e 

2 一 计算 每 个 数值 出 现 的 次 数 。 

3 一 出 现 次 数 最 多 的 数值 就 是 众 数 。 








例如 ,调查 300 个 人 的 政党 背景 会 形成 如 下 的 数据 分 布 结果 。 





政党 背景 次 数 或 频数 
民主 党 90 
共和 党 70 
无 党 派 人 士 140 


众 数 是 出 现 次 数 最 多 的 数值 ,在 上 面 的 例子 中 是 无 党 派 人 士 。 这 就 是 
数据 分 布 的 众 数 。 | 

你 知道 计算 众 数 时 最 容易 、 最 经 常 出 现 的 错误 是 什么 吗 ? 就 是 选择 某 
个 分 类 选项 出 现 的 次 数 而 不 是 分 类 选项 的 标签 本 身 。 对 一 些 人 来 说 很 容 
易 就 可 以 得 出 众 数 是 140 而 不 是 无 党 派 人 士 , 为 什么 ?因为 他 们 看 到 的 是 
数值 出 现 的 次 数 , 而 不 是 最 经 常 出 现 的 那个 数值 ! 这 是 一 个 稍 不 留神 就 会 
犯 下 的 错误 ,因此 让 你 计算 众 数 时 一 定 要 注意 。 
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如 果 数 据 分 布 中 每 一 个 数值 的 出 现 次 数 都 相同 ,那么 就 没有 众 数 。 但 
是 如 果 不 止 一 个 数值 的 出 现 频数 相同 ,那么 这 个 数据 分 布 是 多 峰 分 布 。 数 
据 集 可 能 是 双 峰 分 布 ( 有 两 个 众 数 ) 的 ,如 下 面 头 发 颜色 构成 的 数据 组 所 示 。 


头发 颜色 次 数 或 频数 
红色 7 
金色 12 
黑色 45 
棕色 45 





在 上 面 的 案例 中 ,数据 是 双 峰 分 布 ,因为 黑色 头发 和 棕色 头发 出 现 的 
频数 相同 。 如 果 众 数 相当 接近 但 不 是 完全 相同 ,数据 分 布 也 是 双 峰 分 布 ， 
如 45 个 人 的 头发 是 黑色 ,44 个 人 的 头发 是 棕色 。 问 题 就 成 为 一 种 类 别 在 
多 大 的 程度 上 与 其 他 类 别 相 区 分 ? 你 的 数据 是 否 是 三 峰 分 布 的 ? 那 就 是 
说 出 现 了 三 个 频数 相同 的 数值 。 一 般 来 说 是 不 可 能 的 ,特别 是 在 处 理 大 的 
数据 集 过 程 中 ,但 出 现 的 可 能 性 是 存在 的 。 
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何 时 用 什么 


好 吧 ,我 们 已 经 定义 了 三 种 不 同 的 集中 趋势 量 数 ,而 且 每 一 种 都 给 出 
了 简单 明白 的 案例 。 但 是 还 有 一 个 最 重要 的 问题 没有 回答 , 即 “ 何 时 使 用 
哪 一 种 测量 类 型 ?” 

一 般 来 说 ,使 用 哪 一 种 集中 趋势 量 数 依赖 于 你 描述 的 数据 类 型 。 毫 无 
疑问 ,定性 数据 、 类 别 数据 或 定 类 数据 (如 种 族群 体 、 眼 睛 颜色 收入 档次 、 
选举 次 序 以 及 邻里 位 置 ) 的 集中 趋势 只 可 以 使 用 众 数 来 描述 。 

例如 ,你 不 能 使 用 中 心 值 来 描述 哪 种 政治 立场 在 一 个 组 中 占有 优势 ， 
也 不 能 使 用 均值 一 一 难道 你 可 以 得 出 结论 说 每 一 个 人 是 半 个 共和 党 ? 而 
300 个 人 中 几乎 一 半 (140) 是 无 党 派 人 士 似 乎 是 描述 这 个 变量 值 的 最 好 方 
式 。 一 般 来 说 ,中 位 数 和 均值 最 适合 于 定量 数据 ,如 身高 .具体 收入 水 平 
(不 是 分 类 变量 ) \ 年 龄 .考试 成 绩 \ 反 应 时 间 和 一 定 程 度 上 完成 工作 需要 
的 时 间 。 

当然 也 可 以 很 公平 地 说 均值 是 比 中 位 数 更 精确 的 测量 ,中 位 数 是 比 众 
数 更 精确 的 测量 。 这 意味 着 其 他 条 件 相同 的 情况 下 使 用 均值 ,而 且 均 值 也 
的 确 是 最 常用 的 集中 趋势 量 数 。 但 是 ,我们 的 确 会 遇 到 一 些 均 值 不 适合 作 
为 集中 趋势 量 数 的 情况 一 一 例如 我 们 收集 的 数据 是 类 别 数 据 或 定 类 数据 ， 
例如 头发 颜色 。 那 么 我 们 使 用 众 数 。 因 此 ,这 里 的 三 项 原则 可 能 会 有 一 定 
的 帮助 。 但 是 要 记 住 例外 始终 存在 。 

1. 如 果 数 据 属性 是 分 类 的 ,而 且 数 值 只 属于 一 种 类 型 ,例如 头发 颜色 、 
政治 背景 、 邻 里 位 置 和 宗教 ,就 使 用 众 数 。 在 这 种 情况 下 各 个 分 类 之 间 是 
Н.Е) 

2. 如 果 数 据 中 包含 极 值 而 且 你 不 想 扭曲 平均 数 就 使 用 中 位 数 ,例如 
收入 。 

3. 最 后 ,如 果 数 据 不 包括 极 值 也 不 是 分 类 数据 就 使 用 均值 ,例如 考试 
得 分 或 游 50 码 需 要 的 时 间 。 


述 统计 值 


£ у 
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应 用 计算 机 并 计算 描 


{5 





现在 使 用 SPSS 来 计算 一 些 描 述 统 计 值 。 我 们 使 用 名 称 是 第 2 
章 数 据 集 1(Chapter 2 Data Set 1) 的 数据 集 , 可 以 在 附录 C 得 到 ,也 
可 以 从 Sage 的 网 址 或 者 4 爱 上 统计 学 》 的 主页 下 载 。 这 个 数据 集 


只 有 一 个 变量 。 





2 AZADE ы, жуам 





变量 定义 
Рге) 依据 量 表 测 量 的 偏见 数值 , 值 域 是 1 ~ 100 





本 章 讨论 的 集中 趋势 量 数 可 以 依据 下 面 的 步骤 来 计算 。 按 照 
这 个 步骤 实际 操作 。 通 过 现在 这 个 练习 和 包括 数据 录入 和 下 载 的 
所 有 练习 ,我 们 假定 数据 集 已 经 在 SPSS 打开 。 
1. 点 击 Analyze 一 Descriptive Statistics 一 "Frequencies 。 
2. 双击 变量 Prej 将 它 转移 到 Variable(s) 框 。 
3. 点 击 Statistics , 你 会 看 到 如 图 2.1 所 示 的 下 requencies : Statis- 
tics 对 话 框 。 


Frequencies: Statistics 





图 2.1 SPSS 中 的 频数 分 析 对 话 框 
4. 在 Central Tendency 下 方 ,点 击 Mean „Median 和 Mode 对 应 


的 方 框 。 
5. 点 击 Continue 


6. 点 击 OK。 
SPSS 输出 结果 
图 2.2 所 示 是 变量 Prej 在 SPSS 中 的 输出 结果 。 
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图 2.2 SPSS 的 描述 统计 值 
在 输出 结果 的 Statistics 部 分 ,你 可 以 看 到 一 定 样本 规模 数据 
的 均值 .中 位 数 和 众 数 的 计算 结果 ,而且 没有 缺失 数据 。SPSS 在 输 
出 结果 中 不 使 用 符号 X。 而 且 输 出 结果 中 也 列 出 了 每 一 个 数值 的 
频数 和 每 一 个 数值 发 生 次 数 的 百分比 ,这 都 是 有 用 的 数据 描述 
信息 。 Ке: 





Ду Ж 
不 论 你 的 统计 技术 掌握 到 何 种 程度 ,几乎 都 要 从 简单 的 描述 开始 一 一 因此 
理解 简单 的 集中 趋势 的 概念 很 重要 。 从 现在 开始 ,我 们 学 习 另 一 个 重要 的 描述 


概念 一 一 变异 性 ,也 就 是 数值 之 间 如 何 的 不 同 。 
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练习 时 间 
1. 计算 下 面 给 出 的 第 2 章 数据 集 2(Chapter 2 Data Set 2) 的 三 个 数据 组 的 均 
值 .中 位 数 和 众 数 。 可 以 手动 计算 或 者 使 用 统计 软件 如 SPSS。 给 出 计算 结果 ,如 
果 使 用 SPSS ,打印 输出 结果 。 | 


数据 组 1 数据 组 2 数据 组 3 
1 34 154 
7 54 167 
5 17 132 
4 26 145 
5 34 154 
6 25 145 
7 14 113 
8 24 156 
6 25 154 
5 23 123 


一 一 一 一 77. 


2. 假定 你 是 快 食 店 经 理 。 你 的 工作 之 一 是 向 老板 汇报 每 天 哪 一 种 特惠 食品 
卖 得 最 好 。 应 用 你 学 到 的 描述 统计 的 知识 , 写 一 个 简短 的 报告 让 老板 知道 每 天 
的 经 营 状况 。 不 要 使 用 SPSS 计算 重要 的 数值 ,而 是 手动 计算 。 记 住 备 份 你 的 计 
算 结 果 。 


特惠 食品 售 出 数量 价格 (美元 ) 

Huge Burger 20 2.95 
Baby Burger 18 1.49 
Chicken Littles 25 3.50 
Porker Burger 19 2.95 
Yummy Bugger 17 1.99 
Сопеу Dog 20 1.99 
售 出 总 数 119 


一 ”一 


3. 在 什么 情况 下 使 用 中 位 数 而 不 是 均值 作为 集中 趋势 量 数 ? 为 什么 ? 给 出 
两 个 案例 说 明 中 位 数 作为 集中 趋势 量 数 比 均值 更 有 效 。 


练习 参考 答案 
1; 
数据 组 1 数据 组 2 数据 组 3 
均值 5.1 27.6 144.3 
中 位 数 5.5 25.0 149.5 
众 数 5 25 和 34 154 





2. 你 写 的 报告 可 能 是 这 样 的 : 
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与 通常 一 样 ,Chicken Littles( 众 数 ) 销售 量 最 高 。 食 品 销售 总 额 是 303 美元 ， 
特惠 食品 的 平均 价格 是 2.55 美元 。 

3. 如 果 数 据 存 在 极 值 就 使 用 中 位 数 , 因 为 极 值 会 使 均值 偏离 。 一 个 案例 是 
汇报 收入 时 中 位 数 优 于 均值 。 因 为 均值 变化 较 大 ,而 你 需要 对 极 值 不 敏感 的 集 
中 趋势 量 数 。 男 一 个 案例 是 存在 极 值 或 奇异 值 的 数据 ,例如 一 组 青少年 跑 100 
码 的 速度 存在 极 值 或 奇异 值 ,也 就 是 有 一 两 个 人 跑 得 特别 的 快 。 





Egape З 


本 章 你 会 学 到 什么 


e 为 什么 变异 性 是 有 用 的 描述 工具 
o 如 何 计算 极 差 ,标准 差 和 方差 
o 标准 差 和 方差 如 何 类 似 又 如 何不 同 





为 什么 理解 变异 性 很 重要 


在 第 2 章 已 经 学 习 了 不 同类 型 的 平均 数 , 他 们 的 含义 ,如 何 计算 ,以 及 
何 时 使 用 。 但 是 谈 到 描述 统计 和 数据 分 布 特征 的 描述 ,平均 数 只 是 一 部 
分 , 男 一 部 分 是 变异 性 (或 离散 ) 量 数 。 

在 最 简单 的 词汇 中 变异 性 (variability ) 反映 数值 之 间 的 不 同 。 例 如 下 
面 的 一 组 数据 体现 了 一 定 程度 的 变异 性 : 

7;6,2,2.,1 


接 下 来 的 另 一 组 数据 具有 与 之 相同 的 均值 (4) ,但 变异 性 小 于 前 一 个 
数据 集 : 


3,4,4,5,4 


下 一 个 数据 集 根本 没有 变异 性 一 一 数值 之 间 没 有 差异 ,但 是 还 是 和 前 
面 所 示 的 两 组 数据 具有 相同 的 均值 。 


4,4,4,4,4 


变异 性 (也 叫做 散布 或 离散 度 ) 可 被 看 作 是 对 不 同 数值 之 间 的 差异 性 的 
测量 。 如 果 把 变异 性 看 作 是 每 个 数值 和 特定 值 的 差异 程度 可 能 更 精确 (而 
且 也 许 更 容易 )。 那 么 你 认为 哪 一 个 “数值 ”可 能 被 作为 那个 “特定 值 ” 呢 ? 
通常 情况 下 这 个 “特定 值 ” 就 是 均值 一 一 很 正确 。 因 此 ,变异 性 成 为 测量 数 
据 组 中 每 一 个 数值 与 均值 的 差异 性 的 量 数 。 接 下 来 还 会 继续 讨论 。 

要 记 住 你 已 了 解 的 关于 计算 平均 数 的 内 容 一 一 平均 数 (不 论 是 均值 、 
中 位 数 还 是 众 数 ) 是 一 组 数据 的 代表 数值 。 那 么 现在 增加 关于 变异 性 的 
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新 知识 一 一 它 反 映 的 是 不 同 数 值 和 一 个 值 的 差异 性 。 两 者 都 是 重要 的 描 
述 统计 值 。 这 两 个 值 (平均 数 和 变异 性 ) 可 共同 用 于 描述 数据 分 布 的 特 
征 , 并 说 明 数 据 分 布 之 间 的 差异 。 
变异 性 的 三 种 量 数 通 常用 于 反映 一 组 数据 的 变异 性 、 散 布 或 者 离散 
度 。 这 三 种 量 数 就 是 极 差 ,标准 差 和 方差 。 接 下 来 让 我 们 更 详细 地 了 解 每 
一 个 量 数 以 及 如 何 应 用 。 


计算 极 差 


极 差 是 对 变异 性 最 笼统 的 测量 。 极 差 可 让 你 了 解数 值 之 间 彼 此 差异 
的 程度 。 极 差 (range) 是 通过 数据 分 布 中 的 最 大 值 减 去 最 小 值 来 计算 。 
一 般 来 说 , 极 差 的 计算 公式 如 下 : 


г= Һ- 1 (5: 12 


其 中 
г 是 极 差 
h 是 数据 集中 的 最 大 值 
/是 数据 集中 的 最 小 值 
以 下 面 的 数据 组 (以 降序 的 形式 排列 ) 为 例 : 


98 ,86 ,77 ,56 ,48 
在 这 个 案例 中 ,98 -48 =50。 极 差 是 50。 


实际 上 极 差 有 两 种 类 型 。 一 种 是 不 包含 极 差 ,就 是 用 最 大 值 
20 减 去 最 小 值 (h -1) ,也 是 我 们 刚刚 定义 的 极 差 。 第 二 种 极 差 是 包 
“8 含 极 差 ,就 是 最 大 值 减 去 最 小 值 再 加 1 (h — I+ 1) 。 在 研究 性 文章 
中 通常 看 到 的 是 不 包含 极 差 ,但 一 些 研究 人 员 更 喜欢 使 用 包含 极 

差 ,所 以 也 偶尔 会 在 文章 中 看 到 。 


极 差 几 乎 都 用 于 得 到 不 同 值 之 间 相 互 差别 或 离散 程度 的 非常 笼统 的 
估计 一 一 也 就 是 极 差 表 示 一 个 数据 分 布 中 从 最 小 值 到 最 大 值 之 间 的 距离 。 

因此 ,虽然 极 差 作为 变异 性 的 一 般 指 标 很 好 ,但 是 不 可 以 用 于 得 出 任 
何 关 于 具体 的 数值 之 间 相 互 差 别 的 结论 。 


计算 标准 差 


现在 开始 学 习 最 常用 到 的 变异 性 量 数 一 一 标准 差 。 如 果 仅 仅 考虑 字 
面 的 含义 ,就 是 标准 化 了 的 与 某 个 值 ( 猜 猜 是 哪 一 个 值 ) 的 偏差 。 实 际 上 ， 
标准 差 ( standard deviation ,缩写 为 s 或 SD) 表 示 一 个 数据 组 中 变异 性 的 平 


28 





ааа», ран 
均 数 量 。 实 际 的 含义 是 与 均值 的 平均 距离 。 标 准 差 越 大 ,每 一 个 数据 点 与 
数据 分 布 的 均值 的 平均 距离 越 大 。 

因此 ,支持 标准 差 计 算 的 逻辑 是 什么 ? 你 最 初 的 想法 可 能 是 计算 数据 
组 的 均值 ,接着 用 均值 减 去 每 一 个 数值 。 然 后 计算 这 些 距离 的 平均 数 。 

这 个 想法 很 好 一 一 最 后 你 会 得 到 每 一 个 数值 与 均值 的 平均 距离 。 但 
是 实际 上 这 不 管用 (你 是 否 知 道 为 什么 , 接 下 来 我 们 会 说 明 原 因 ) 。 

下 面 给 出 计算 标准 差 的 公式 : 

(3.2) 


£= "Y (ЖЛ) 
n — 1 
其 中 | 
s 是 标准 差 
> 是 西格玛 ,表示 将 其 后 所 有 数值 累加 求 和 
Х 是 具体 的 数值 
X 是 所 有 数值 的 均值 
是 样本 规模 


公式 中 可 以 看 到 每 一 个 数值 和 均值 之 间 的 差 (X- 关 ) ,每 一 个 差 的 平 
方 , 并 且 计 算 所 有 平方 值 的 总 和 。 然 后 用 平方 和 除 以 样本 规模 ( 减 去 1), 
最 后 求 平方 根 。 就 如 你 所 看 到 的 ,也 和 我 们 早已 指出 的 一 样 ,标准 差 是 每 
个 数值 与 均值 的 偏差 的 平均 数 。 

我 们 用 下 面 的 数据 逐步 解释 如 何 计算 标准 差 : 


S004 0 7 8.8 3.0 


1 一 列 出 每 一 个 数值 。 数 值 如 何 排序 不 重要 。 
2 一 计算 数据 组 的 均值 。 

3 一 每 一 个 数值 减 去 均值 。 

下 面 就 是 我 们 现在 完成 的 工作 ,其 中 立 -X 表 示 每 一 个 数值 与 所 有 
数值 的 均值 之 间 的 差 ,均值 是 6。 


Х 


Q) P «л Q O. O оо 0 
ооо с O, O, ооо? | | 


4 一 计算 每 一 个 差 值 的 平方 。 计 算 结 果 在 对 应 的 (X — X)? 列 。 
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5 一 计算 所 有 与 均值 的 偏差 的 平方 的 总 和 。 如 在 上 表 中 看 到 的 ,总 


和 是 28。 


6 一 平方 和 除 以 m -1, 也 就 是 10 -1 =9, 那 么 28/9 =3.11。 
7 一 计算 3. 11 的 平方 根 ,结果 是 1.76( 四 舍 五 人 之 后 )。 也 就 是 这 


10 个 数值 的 标准 差 。 


从 结果 我 们 可 以 知道 ,数据 分 布 中 每 一 个 数值 与 均值 的 偏差 的 平均 数 


Ж 1. 76. 


现在 我 们 做 一 个 简短 的 回顾 ,分 析 一 下 运用 标准 差 公 式 的 计算 过 程 。 
这 些 过 程 很 重要 ,需要 回顾 ,而 且 会 增加 对 标准 差 是 什么 的 理解 。 
首先 ,为 什么 我 们 不 简单 地 将 与 均值 的 偏差 累加 起 来 ? 因为 与 均值 偏 
差 的 总 和 一 般 都 等 于 0。 试 着 计算 偏差 (2+2+2+1+0+0-1-1-2- 
3) 的 总 和 。 实 际 上 ,这 也 是 检查 均值 计算 是 否 正 确 的 最 好 方式 。 


你 可 能 会 看 到 另 一 种 类 型 的 偏差 ,而且 你 应 该 了 解 它 的 含义 。 


49)» 平均 偏差 (mean deviation 也 叫做 平均 绝对 偏差 ) 是 与 均值 偏差 的 绝 
() 


对 值 的 总 和 。 你 已 经 知道 与 均值 偏差 的 总 和 一 定 等 于 0( 否 则 就 可 
能 是 均值 计算 错误 )。 那 么 ,我 们 取 每 一 个 偏差 的 绝对 值 (也 就 是 
不 管 正 负 号 的 数值 )。 将 这 些 绝对 值 累加 起 来 ,然后 除 以 数据 点 的 
个 数 , 你 就 得 到 平均 偏差 (注意 :一 个 数 的 绝对 值 通常 用 两 边 带 有 
竖 线 的 数值 表示 ,就 如 151。 例 如 -6 的 绝对 值 是 1 -61, 也 就 是 


6)。 





其 次 ,为 什么 我 们 计算 偏差 的 平方 ? 因为 我 们 想 消 除 负 号 ,这样 就 使 


得 累加 偏差 的 时 候 总 和 不 为 0。 


最 后 ,为 什么 第 7 步 是 以 计算 总 值 的 平方 根来 结束 ? 因为 我 们 想 回 到 
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开始 时 的 计算 单位 。 我 们 在 第 4 步 计算 与 均值 偏差 的 平方 (消除 负 值 ) , 
接着 在 第 7 步 计算 总 值 的 平方 根 。 这 就 是 有 始 有 终 。 


为 什么 使 用 几 一 1 ,而 不 是 n 


你 可 能 已 经 猜 出 我 们 为 什么 对 均值 偏差 进行 平方 ,以 及 为 什么 求 总 和 
的 平方 根 。 但 是 为 什么 公式 中 的 分 母 要 减 去 1 呢 ? 为 什么 我 们 除 以 -1 
而 不 只 是 n 062 这 是 个 很 好 的 问题 。 

BERIE s( 标 准 差 ) 是 总 体 标准 差 的 估计 值 ,但 是 只 有 我 们 用 nn 减 去 1 
的 情况 下 才 是 无 偏 估计 。 我 们 把 分 母 减 去 1 会 使 得 标准 差 大 于 实际 的 大 
小 。 为 什么 我 们 要 这 样 做 ? 因为 好 的 科学 家 一 般 都 是 保守 的 。 保 守 的 含 
义 是 ,如 果 我 们 不 得 不 出 错 ,我们 出 错 也 是 由 于 过 高 估计 了 总 体 的 标准 差 。 
除 以 较 小 的 分 母 可 让 我 们 做 到 这 一 点 。 因 此 ,我 们 除 以 9 而 不 是 10 ,或 者 
我 们 是 除 以 99 而 不 是 100。 





`6 
> 如 果 你 的 目的 是 描述 样本 的 特征 ,有 偏 估计 也 可 以 。 但 如 果 
) 


你 想 用 样本 估计 总 体 参数 ,最 好 要 计算 无 偏 统计 值 。 





看 看 下 面 的 数据 表 , 你 会 发 现 样 本 规模 变 大 (并 且 逐 渐 接近 总 体 规 
模 ) 会 发 生 什么 。n -1 的 调整 对 于 标准 差 的 有 偏 估计 和 无 偏 估计 之 间 的 
差异 的 影响 越 来 越 小 (数据 表 中 黑体 字 一 栏 ) 。 其 他 各 项 一 致 的 情况 下 ， 
样本 规模 越 大 标准 差 的 有 偏 估计 和 无 偏 估 计 之 间 的 差异 越 小 。 认 真 看 下 
面 的 数据 表 ,你 会 了 解 我 们 所 说 的 内 容 。 


样本 规模 ”公式 中 分 子 ”总 体 标准 差 的 有 ” 总体 标准 差 的 无 有 偏 估计 和 
的 数值 偏 估计 ( 除 以 n) ” 偏 估计 ( 除 以 x-1) 无 偏 估计 的 差异 
10 500 7.07 7.45 0. 38 


100 500 2. 24 2. 25 0.01 
1000 500 0. 707 1 0. 707 5 0. 000 4 








那么 其 中 的 规律 是 什么 ? 当 你 计算 样本 的 标准 差 用 于 估计 总 体 的 参 
数值 时 ,样本 规模 越 接近 总 体 规模 ,估计 就 会 越 准确 。 


重要 的 是 什么 


标准 差 的 计算 很 简单 。 但 是 标准 差 的 含义 是 什么 ?作为 一 个 变异 性 的 
量 数 ,标准 差 可 以 告诉 我 们 数据 组 的 每 一 个 数值 与 均值 的 偏差 平均 数 。 但 
是 就 如 在 第 四 章 可 以 看 到 的 ,标准 差 有 一 些 非常 实际 的 应 用 。 为 了 刺激 学 
习 的 兴趣 ,考虑 这 一 点 :标准 差 可 用 于 帮助 我 们 比较 来 自 不 同 数据 分 布 的 数 
值 ,即使 均值 和 标准 差 不 同 。 很 奇妙 吧 ! 这 就 如 你 将 会 看 到 的 ,非常 酷 。 
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需要 记忆 的 内 容 


? 


o 标准 差 是 作为 偏离 均值 的 平均 距离 计算 的 。 因 此 ,你 首先 需要 计 
算 作为 集中 趋势 量 数 的 均值 。 因 此 计算 标准 差 时 不 需要 在 中 位 数 


5 和 众 数 上 浪费 时 间 。 


Z 


/标准 差 越 大 ,数值 分 布 越 广 , 则 数值 之 间 的 相互 差异 越 大 。 


е 和 均值 一 样 ,标准 差 对 极 值 很 敏感 。 当 你 计算 样本 的 标准 差 时 ,着 
数据 中 存在 极 值 ,你 就 要 在 数据 报告 中 注 明 这 一 点 。 

ө s =0, 数 据 组 中 就 绝对 没有 变异 性 ,而且 在 数值 上 完全 一 致 。 
这 种 情况 很 少 发 生 。 


计算 方差 


这 是 另 一 个 变异 性 量 数 ,而 且 也 让 人 感到 惊奇 。 如 果 你 知道 一 个 数据 
组 的 标准 差 , 而 且 可 以 计算 一 个 数 的 平方 , 那 就 可 以 很 容易 地 计算 相同 数 
据 组 的 方差 。 第 三 个 变异 性 量 数 ,也 就 是 方差 (variance) ,就 是 标准 差 的 
平方 。 

换 句 话说 ,就 是 你 之 前 看 到 的 公式 ,只 是 没有 平方 根 符号 ,就 如 公式 
3.3 所 示 : 


хы 020 


nl 


653,32 


如 果 你 计算 标准 差 时 没有 完成 最 后 一 步 ( 计 算 平 方 根 ) , 那 就 得 到 方 
差 。 换 句 话说 ,s* =s xs, 就 是 方差 等 于 标准 差 自 乘 一 次 (或 平方 ) 。 在 我 
们 的 早 前 案例 中 ,标准 差 等 于 1. 76 ,方差 等 于 1.76 ,也 就 是 3. 11。 

你 不 大 可 能 在 杂志 的 文章 中 看 到 方差 被 提 到 ,或 者 看 到 方差 被 用 作 描 
述 统计 。 这 是 因为 方差 值 很 难 解释 或 很 难 用 于 一 组 数据 。 总 之 ,方差 来 自 
于 偏差 值 的 平方 。 

但 是 方差 很 重要 ,因为 方差 不 仅 是 一 个 概念 ,也 是 许多 统计 公式 和 技 
术 中 实际 应 用 的 变异 性 量 数 。 你 会 在 《4 爱 上 统计 学 》 后 面 的 部 分 了 解 
更 多 。 


вж 5 z £ 

标准 差 和 方差 哪些 方面 相同 ,哪些 方面 不 同 ? 

它们 都 是 变异 性 ,离散 度 或 散布 的 量 数 。 用 于 计算 两 者 的 公式 非常 类 
似 。 你 常常 会 在 杂志 文章 的 “结果 ”部 分 看 到 两 者 。 


但 是 它们 也 非常 的 不 同 。 
首先 而 且 最 重要 的 是 ,标准 差 ( 因为 我 们 计算 偏差 平方 和 均值 的 平方 


32 42%2% алы 


根 ) 以 最 初 的 计算 单位 存在 。 方 差 以 平方 单位 存在 (没有 计算 平方 根 ) 。 

这 是 什么 意思 ? 假定 我 们 需要 知道 一 组 装配 电路 板 的 生产 工人 的 变 
寞 性。 我 们 假定 他 们 每 个 小 时 平均 装配 8. 6 个 电路 板 , 标 准 差 是 1. 59, 
数值 1. 59 的 意义 是 每 个 小 时 装配 的 电路 板 与 均值 的 平均 差异 是 1. 59 个 
电路 板 。 

让 我 们 看 看 方差 的 解释 ,方差 是 1. 59°, вй 2. 53. 方差 可 解释 的 含义 
是 工人 每 个 小 时 安装 的 电路 板 与 均值 的 平均 差异 的 平方 大 约 是 2. 53 个 电 
路 板 。 这 两 个 值 哪个 更 有 解释 意义 ? 











使 用 计算 机 计算 变异 性 量 数 
我 们 使 用 SPSS 软件 计算 变异 性 量 数 。 我 们 使 用 的 数据 文件 ` 
是 第 3 章 数 据 集 1(Chapter 3 Data Set 1), 
©. 这 个 数据 集 只 有 一 个 变量 : 
变量 定义 
reac_tm ЕМУ ЙУ БОЛУН [8] 


下 面 是 计算 本 章 讨论 的 变异 性 量 数 的 步骤 : 

1. 打开 名 称 为 第 3 章 数据 集 1( Chapter 3 Data Set 1) 的 文件 。 

2. 点 击 Analyze 一 Descriptive Statistics—F requencies。 

3. 双击 变量 reac_tm 将 变量 reac_tm 移 到 | Variability(s) 框 。 

4. 点 击 Statistics ,你 会 看 到 Frequencies ; Statistics 对 话 框 。 使 用 
这 个 对 话 框 来 选择 你 想 要 运行 的 变量 和 程序 。 

5. 在 Dispersion 选项 下 ,点击 Std. Deviation, 

6. 在 Dispersion 选项 下 ,点 击 Variance, 

7. 在 Dispersion 选项 下 ,点 击 Range。 

8. 点 击 Continue。 

9. 点 击 OK。 


SPSS 输出 结果 


图 3.1 所 示 是 变量 reac_tm 在 SPSS 中 的 输出 结果 。 这 里 有 30 个 有 效 
案例 ,而 且 没有 缺失 案例 ,而且 标准 差 是 .702 55。 方差 ( 或 ，* ) 等 于 .493 57, 
极 差 是 2. 60。 


* 根据 上 下 文 意思 应 是 ss。 一 一 译 者 注 
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小 结 
变异 性 量 数 帮助 我 们 更 全 面 地 了 解数 据点 的 分 布 。 与 集中 趋势 量 数 一 起 ， 
我 们 可 以 使 用 这 些 数值 来 区 别 不 同 的 数据 分 布 ,而 且 有 效 地 描述 一 组 考试 分 数 、 
身高 或 个 性 测量 得 分 的 分 布 。 现 在 我 们 可 以 思考 和 讨论 数据 分 布 ,也 让 我 们 能 
够 以 不 同 的 方式 来 考察 这 些 数据 。 


练习 时 间 
1. 为 什么 极 差 是 最 方便 的 离散 量 数 ? 而 且 是 最 不 精确 的 变异 性 量 数 ? RN 
何 时 使 用 极 差 ? 
2. 计算 下 面 的 数据 集 的 极 差 . 无 偏 标准 差 、 有 偏 标 准 差 和 方差 。 请 手动 
计算 。 
31,42,35 ,55 ,54 ,34 ,25 ,44 ,35 
3. 为 什么 无 偏 估 计 大 于 有 偏 估计 ? 
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4. 使 用 名 称 为 第 3 章 数 据 集 2( Chapter 3 Data Set 2) 的 数据 文件 中 所 包含 的 
数据 进行 练习 。 这 个 数据 集中 有 两 个 变量 。 


变量 定义 
身高 单位 是 英寸 的 身高 
体重 单位 是 磅 的 体重 


使 用 SPSS 计算 身高 和 体重 的 所 有 变异 性 量 数 。SPSS 计算 的 是 有 偏 还 是 无 
偏 估计 ? 你 怎么 知道 的 ? 


练习 参考 答案 
1. 极 差 是 最 方便 的 离散 量 数 ,因为 极 差 只 需要 用 一 个 数 ( 最 大 值 ) 减 去 另 一 
个 数 (最 小 值 )。 因 为 极 差 没有 考虑 数据 分 布 中 最 大 值 和 最 小 值 之 间 的 数值 ,所 
以 极 差 不 精确 。 如 果 你 需要 一 个 大 概 ( 而 不 是 非常 精确 ) 的 数据 分 布 的 变异 性 估 
计 , 就 使 用 极 差 。 
2. 极 差 是 30。 


无 偏 估计 有 偏 估计 
5 10.19 9.60 





无 偏 的 样本 标准 差 等 于 10.19。 有 偏 的 样本 标准 差 等 于 9.6。 两 者 的 差异 是 
由 于 一 个 除 以 样本 规模 8( 是 无 偏 估计 ) ,而 另 一 个 除 以 样本 规模 9( 是 有 偏 估 
计 )。 方 差 的 无 偏 估计 是 103.78 ,有 偏 估计 是 92.25。 

3. 因为 我 们 有 目的 地 要 保持 保守 性 ,并 倾向 于 高 估 总 体 标准 差 的 大 小 ,所 以 
无 偏 估计 总 是 大 于 有 偏 估计 。 

4. 下 面 的 统计 表 给 出 了 汇总 的 统计 结果 。 看 起 来 很 熟悉 ? 它 应 该 一 一 实际 
上 就 像 SPSS 的 输出 结果 。 


统计 值 
身高 体重 
N 有 效 案例 20 20 
缺失 案例 0 0 
标准 差 11.436 15. 652 
方差 130.779 244. 997 


极 差 43 59 





由 图 真 的 相当 于 千 诗 万 语 


本 章 你 会 学 到 什么 


e 为 什么 一 幅 图 真 的 相当 于 千言 万 语 
e 如 何 建立 直方 图 和 多 边 形 图 

e 不 同类 型 的 统计 表 和 它们 的 应 用 

o 使 用 Excel 和 SPSS 建立 统计 图 表 


为 什么 要 用 图 表 说 明 数 据 


前 面 的 两 章 已 经 学 习 了 两 种 类 型 的 描述 统计 一 一 集中 趋势 量 数 和 变异 
性 量 数 。 这 两 者 可 以 提供 一 个 最 好 的 值 描述 一 组 数据 (集中 趋势 ) ,以 及 测 
量 数值 之 间 彼 此 差异 或 不 同 的 程度 (变异 性 ) 。 

我 们 之 前 没有 做 而 现在 要 做 的 是 考察 看 起 来 不 同 的 数据 分 布 中 两 类 
测量 结果 的 差异 程度 。 数 字 本 身 ( 例 如 =10,s =3) 很 重要 ,但 是 形象 地 
表示 是 更 有 效 地 描述 数据 分 布 特征 和 数据 集 特征 的 方式 。 

因此 在 这 一 章 我 们 将 学 习 如 何 形象 地 表示 数值 的 分 布 ,以 及 如 何 使 用 
不 同类 型 的 图 形 来 表示 不 同类 型 的 数据 。 


好 图 表 的 十 个 方面 ( 少 贪 新 ,多 练习 ) 


无 论 你 是 手动 或 者 使 用 计算 机 软件 建立 图 形 , 这 些 实用 的 图 形 设计 原 
则 都 适用 。 这 里 有 十 条 原则 需要 参照 ,而 且 应 该 挂 在 你 的 案头 。 

І. 减少 图 或 表 中 无 用 的 内 容 。“ 图 表 垃 圾 "(类 似 于 “废话 ”) 是 指使 
用 了 计算 机 软件 的 每 一 个 函数 、 图 表 和 性 能 ,由 此 制作 的 图 表 中 密 密 膝 麻 
地 挤 满 了 没 用 的 信息 。 这 类 东西 绝对 是 越 少 越 好 。 

2. 在 开始 制作 最 后 的 图 表 之 前 要 制作 草图 。 即 使 准备 使 用 计算 机 软 
件 制 作 图 表 也 要 使 用 制图 纸 。 

з. 说 想 说 的 ,而 且说 了 要 说 的 一 一 不 多 不 少 。 没 有 比 堆积 图 表 ( 附 市 
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过 上 统计 学 


太 多 的 文字 和 花哨 的 特征 ) 迷惑 读 者 更 坏 的 事情 了 。 


4. 给 所 有 的 内 容 贴标签 ,不 要 留 下 让 读者 不 理解 的 内 容 。 

5. 一 个 图 表 应 该 只 传递 一 个 观点 。 

б. 保持 图 表 平 衡 。 建 立 图 表 时 ,标题 和 数 轴 标 签 要 置 中 。 

7. 保持 图 表 的 比例 。 比 例 是 指 横 轴 和 纵 轴 之 间 的 关系 。 这 里 的 比例 
通常 是 3 比 4, 也 就 是 图 表 的 宽 若 是 3 英寸 ,那么 高 就 是 4 英寸 。 

8. 简单 最 好 。 保 持 图 表 简 单 ,但 不 能 过 于 简化 。 尽 可 能 只 表达 一 个 观 
点 ,而 减 去 的 信息 在 接 下 来 的 正文 中 保留 。 记 住 ,一 个 图 或 表 应 该 单独 存 
ХЕ ,而且 读 者 能 够 理解 传递 的 信息 。 | 

9. 限制 你 所 使 用 的 单词 数目 。 单 词 太 多 或 者 单词 字 节 数 太 多 ,就 会 削 
弱 你 的 图 表 传递 的 直观 信息 。 

10. 一 个 图 要 能 够 传递 你 要 表达 的 内 容 。 如 果 不 能 ,返回 准备 阶段 重 


新 制作 。 


首先 是 建立 频数 分 布 


用 图 表 说 明 数 据 的 最 基本 的 方式 是 建立 频数 分 布 。 频 数 分 布 (fre- 
quency distribution) 是 记录 和 展现 特定 数据 出 现 次 数 多 少 的 方法 。 在 建立 
频数 分 布 过 程 中 ,数值 通常 依据 一 定 的 组 距 或 数值 范围 分 组 。 

现 有 的 数据 是 50 个 阅读 理解 考试 的 成 绩 ,以 及 这 些 考试 成 绩 的 频数 分 布 。 

下 面 是 建立 频数 分 布 的 原始 数据 : 


47 
Z 
44 
41 
7 
6 
35 
38 
35 
36 


10 
11 
14 
14 
30 
30 
32 
33 
34 
32 


这 是 频数 分 布 表 : 





组 距 
45 ~49 
40 ~44 
35 ~39 
30 ~34 
25 -29 
20 ~24 
15 ~19 
10 ~14 
5~9 
0~4 


31 
31 
15 
16 
17 
16 
15 
19 
18 
16 


25 
25 
26 
26 
27 
29 
29 
28 
29 
27 


ео ы - |Ж 
ооо Ж 


= кю A оо 


20 
21 
21 
21 
24 
24 
23 
20 
21 
20 
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就 如 你 在 上 表 中 所 看 到 ,组 距 ( dass interval) 是 一 个 值 域 范围 ,而 且 建 
立 频 数 分 布 的 第 一 步 就 是 定义 每 一 个 组 距 的 大 小 。 在 我 们 建立 的 频数 分 
布 中 可 以 看 到 ,每 一 个 组 距 包 含 5 个 值 ,例如 5 ~9( 包 含 5,6,7,8 和 9) 和 
40 ~44( 包 含 40,41,42,43 和 44)。 我 们 如 何 决 定 一 个 组 距 只 包含 5 个 值 ? 
为 什么 不 是 各 包含 10 个 数值 的 5 个 组 距 ? 或 者 各 包含 25 个 数值 的 两 个 
组 距 ? 

不 论 你 处 理 的 数据 集中 数值 的 规模 有 多 大 ,建立 组 距 要 参照 如 下 一 些 
一 般 原 则 。 | 

1. 选择 一 个 包含 2,5 ,10 或 20 个 数据 点 的 组 距 。 在 我 们 的 案例 中 , 选 
择 了 包含 5 个 数据 点 的 组 距 。 

2. 选择 一 个 组 距 ,使 得 10 ~ 20 个 这 样 的 组 距 就 可 以 覆盖 所 有 的 数据 。 
完成 这 一 步 的 简便 方式 是 计算 极 差 ,接着 除 以 你 想 使 用 的 组 距 的 个 数 (10 
~20) 。 在 我 们 的 案例 中 有 50 个 数值 ,而 且 我 们 想 用 10 个 组 距 :50/10 = 
5 ,这 就 是 每 一 个 组 距 的 规模 。 如 果 你 有 一 个 值 域 范围 是 100 ~ 400 的 数据 
集 , 你 可 以 从 下 面 的 估计 开始 并 以 此 为 基础 计算 :300/20 =15 ,因此 15 就 

是 组 距 。 

3. 根据 组 距 把 所 有 分 组 罗列 出 来 。 在 之 前 给 出 的 频数 分 布 中 ,组 距 是 
5 ,而 且 我 们 的 最 低 组 距 以 0 开始 。 

4. 最 后 ,最 大 的 组 距 处 在 频数 分 布 的 顶端 。 

一 旦 建立 了 组 距 , 就 着 手 完成 频数 分 布 的 频数 部 分 。 这 就 是 简单 的 计 
算 原 始 数 据 中 每 一 个 数值 出 现 的 次 数 , 接 着 将 这 个 数字 放 入 这 个 数值 代表 
的 组 距 。 

在 我 们 之 前 建立 的 频数 分 布 中 ,在 30 和 34 之 间 出 现 的 数值 的 个 数 或 
在 30 ~34 的 组 距 中 数值 的 个 数 是 8。 因 此 ,8 写 人 频数 所 对 应 的 列 。 这 就 
是 频数 分 布 。 


图 形 密度 :建立 直方 图 


现在 ,我 们 已 经 得 到 了 多 少数 值 落 信 对 应 组 距 的 记录 ,接着 就 进入 下 
_ 步 并 建立 直方 图 一 频数 分 布 的 形象 表示 ,图 中 频数 以 条 形 表示 。 
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依据 下 面 的 步骤 建立 直方 图 。 

1 一 使 用 制图 纸 ,在 蕊 轴 等 距离 地 列 出 数值 ,如 图 4.1 所 示 。 现 在 
确定 组 距 的 组 中 值 ,也 就 是 位 于 组 距 中 间 的 数据 点 。 组 中 值 很 
容易 计算 ,一眼 就 看 得 出 来 ,但 是 你 也 可 以 简单 地 将 组 距 的 最 
大 值 和 最 小 值 加 起 来 然后 除 以 2。 例 如 0 ~4 组 距 的 组 中 值 是 0 
和 4 的 平均 数 ,也 就 是 4/2 =2。 





0 724 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 
组 距 和 组 中 值 (| ) 





图 4.1 沿 x- 轴 的 组 距 

2 一 围绕 每 一 个 代表 组 距 的 组 中 值 (midpoint ) 绘制 高 度 为 代表 这 个 
组 距 频 数 的 条 形 或 柱 形 。 例 如 在 图 4.2 中 ,你 可 以 看 到 的 第 一 
个 条 形 , 也 就 是 0 ~4 组 距 是 由 频数 1 代表 (表示 1 乘 以 0 到 4 
之 间 的 一 个 值 )。 继 续 绘制 条 形 或 柱 形 直到 每 一 个 组 距 的 频数 
都 用 图 形 得 到 表示 。 下 面 是 一 幅 很 不 错 的 手绘 的 表示 我 们 之 
前 提 到 的 50 个 数值 的 频数 分 布 的 直方 图 。 

注意 每 一 个 组 距 是 如 何 由 x 轴 的 一 定 值 域 代表 的 。 
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44.2 手绘 直方 图 





计数 方法 

通过 在 这 一 章 开 始 看 到 的 简单 的 频数 分 布 表 就 可 以 了 解 , 比 起 简单 地 
列 出 数据 ,你 可 以 对 数值 分 布 了 解 更 多 。 你 会 对 有 什么 数据 和 数据 发 生 的 
频数 有 很 好 的 了 解 。 但 是 另外 的 形象 表示 (直方 图 之 外 ) 可 以 通过 对 每 一 
个 数值 发 生 的 次 数 的 记录 来 完成 ,如 图 4.3 所 示 。 


Ш ммм 

Р”, 4 ААА ТАГАРА 
АТТА ТАИТ E E A ТСЕ НЕЕ 
bebe a ll a I L E ET TTT TETT 


5~9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 


组 距 





图 4.3 记录 数值 
我 们 使 用 与 特定 组 距 所 包含 的 数值 的 频数 一 致 的 记录 。 这 种 方式 可 
以 更 直观 地 表示 一 个 数值 相对 于 另 一 个 数值 出 现 的 次 数 的 多 少 。 


下 一 步 :频数 多 边 形 图 


建立 直方 图 或 数值 记录 图 不 是 很 困难 ,而 一 下 步 (下 一 个 用 图 形 说 明 
数据 的 方式 ) 更 容易 。 我 们 准备 使 用 相同 的 数据 实际 上 就 是 刚才 建 
立 的 直方 图 建立 频数 多 边 形 图 (frequency polygon) 。 频 数 多 边 形 图 是 
代表 组 距 内 数值 频数 的 连续 线段 ,如 图 4.4 所 示 。 
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5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 
组 距 





4.4 “手绘 频数 多 边 形 图 





如 何 绘制 频数 多 边 形 图 ?” 按照 下 面 的 步骤 来 做 。 
1 一 在 直方 图 的 条 形 或 柱 形 的 顶端 设置 组 中 值 。( 见 图 4.4) 
2 一 用 线段 连接 组 中 值 就 得 到 它 一 一 频数 多 边 形 图 。 








注意 在 图 4.4 中 ,作为 频数 多 边 形 图 建立 基础 的 直方 图 是 用 横 线 和 坚 
线 绘制 ,而 多 边 形 图 是 用 曲线 绘制 。 这 是 因为 ,即使 我 们 想 让 你 看 到 频数 
多 边 形 图 建立 的 基础 ,通常 你 也 看 不 到 在 多 边 形 图 之 下 的 直方 图 。 

为 什么 使 用 频数 多 边 形 图 而 不 是 直方 图 来 表示 数据 ? 频数 多 边 形 图 
是 更 优 的 选择 。 频 数 多 边 形 图 看 起 来 比 直 方 图 (表示 频数 变化 的 直线 看 
起 来 总 是 更 整齐 ) 更 生动 ,但 是 基本 上 涵盖 的 是 相同 的 信息 。 
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累计 频数 


如 果 建 立 了 频数 分 布 ,而 且 已 经 用 直方 图 或 频数 多 边 形 图 对 那些 数据 
进行 了 形象 地 解释 ,那么 还 有 另 一 种 选择 就 是 建立 组 距 内 数值 的 累计 发 生 
频数 的 形象 图 示 。 这 就 是 累计 频数 分 布 (camulative frequency diseribu- 
боп) o ! 

累计 频数 分 布 建 立 的 基础 是 相同 数据 的 频数 分 布 ,但 是 多 增加 了 一 列 
(累计 频数 ) ,如 下 表 所 示 。 








组 距 频数 累计 频数 
45 ~49 1 50 
40 -44 2 49 
35 ~39 4 47 
30 -34 8 43 
25 -29 10 35 
20 ~ 24 10 25 


15 ~ 19 
10 ~ 14 
5-9 
0-4 


15 
7 
3 
1 


— N + со 





累计 频数 分 布 的 开始 是 建立 标签 为 累计 频数 的 新 的 一 列 。 接 着 将 一 
个 组 距 的 频数 和 其 下 的 所 有 频数 加 起 来 。 例 如 ,0 ~4 组 距 的 发 生 频数 是 
1 ,在 这 一 组 之 下 没有 其 它 组 距 , 因 此 累计 频数 是 1。 对 于 5 ~9 组 距 来 说 ， 
这 一 组 的 发 生 频数 是 2, 这 一 组 之 下 的 发 生 频 数 是 1 ,因此 这 一 组 或 这 一 组 
之 下 的 总 的 频数 是 3(1 +2)。 最 后 的 组 距 (45 ~ 49) 发 生 频数 是 1 ,因此 这 
一 组 或 这 一 组 之 下 的 总 的 频数 是 50。 

一 且 我 们 建立 了 累计 频数 分 布 ,那么 数据 就 可 以 用 图 表示 为 直方 图 或 
频数 多 边 形 图 。 只 有 这 一 次 我 们 跳 过 了 一 些 内 容 , 并 且 绘 制 每 一 个 组 距 的 
组 中 值 作为 这 个 组 距 的 累计 频数 。 你 可 以 在 图 4.5 看 到 以 这 一 章 开 始 提 
供 的 50 个 数值 为 基础 建立 的 累计 频数 分 布 。 
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4.5 手绘 累计 频数 分 布 


@ 累计 频数 多 边 形 图 的 另 一 个 名 称 是 肩 形 图 (ogive) 。 而 且 ,如 果 
2, 数据 是 正 态 分 布 ( 见 第 7 章 更 多 的 内 容 ) , 肩 形 图 呈现 出 的 就 是 更 为 
@ 大 家 了 解 的 钟 形 曲 线 或 正 态 分 布 。SPSS 可 以 建立 很 好 的 肩 形 


图 一 一 也 称 作 Р-Р 图 (用 于 概率 图 ) ,而 且 很 容易 建立 。 阅 读 附 录 A 
关于 使 用 SPSS 建立 图 表 的 介绍 ,而 且 阅 读本 章 接 下 来 所 有 的 内 容 。 





扁平 和 细 长 的 频数 分 布 


现在 你 可 以 一 定 程度 地 推断 数据 分 布 相互 之 间 在 许多 方面 非常 的 不 
同 。 实 际 上 ,在 四 个 方面 不 同 :平均 值 、 变 异性 、 偏 度 (也 叫 倾斜 度 一 一 详 
者 注 ) 和 峰 度 。 后 面 的 两 项 是 新 的 概念 ,我 们 会 在 图 形 展 示 这 两 项 时 青 进 
行 定义 。 现 在 依次 定义 这 四 项 特征 值 ,并 且 用 图 形 说 明 。 
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平均 值 


我 们 再 次 回顾 集中 趋势 量 数 。 如 图 4.6 所 示 ,你 会 看 到 三 个 不 同 的 数 
据 分 布 的 平均 值 的 差异 程度 。 你 会 看 到 数据 分 布 C 的 平均 值 大 于 分 布 B 
的 平均 值 ,相应 的 分 布 B 的 平均 值 大 于 分 布 A 的 平均 值 。 


频数 


最 小 值 。 ”分 布 A 均 值 вий снин ЖАЙ 
图 4.6 数据 分 布 的 平均 值 差异 程度 
变异 性 
在 图 4.7 中 你 可 以 看 到 具有 相同 平均 值 但 是 变异 性 不 同 的 三 个 数据 


分 布 。 数 据 分 布 A 的 变异 性 小 于 数据 分 布 B 的 变异 性 ,相应 的 分 布 B 的 
变异 性 小 于 分 布 C 的 变异 性 。 换 名 话说 就 是 三 个 数据 分 布 中 分 布 С 的 变 


异性 最 大 ,分 布 A 的 变异 性 最 小 。 


分 布 A 


频数 





最 小 值 平均 值 最 大 值 
图 4.7 数据 分 布 的 变异 性 差异 程度 


а Ж 


MBE ( skewness ) 是 对 数据 分 布 对 称 性 缺失 或 者 分 布 不 平衡 的 测量 。 
换 句 话说 就 是 分 布 的 一 个 “尾巴 ” 比 另 一 个 长 。 例 如 在 图 4.8 中 ,数据 分 
布 A 的 右 侧 尾 比 左 侧 尾 长 ,相应 的 就 是 分 布 的 大 数值 一 端的 发 生 次 数 较 
小 。 这 是 正 偏 度 分 布 。 这 个 案例 就 是 这 种 情况 : 当 你 参加 一 次 难度 非常 大 
的 考试 ,只 有 少数 学 生 取 得 相当 高 的 成 绩 ,而 大 多 数学 生 的 成 绩 相当 低 。 
分 布 C 的 右 侧 尾 比 左 侧 尾 短 ,相应 的 就 是 分 布 的 大 数值 一 端的 发 生 次 数 
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较 大 。 这 是 负 偏 度 分 布 ,难度 较 小 的 考试 就 是 这 种 情况 (大 多 数 是 高 分 ， 
相应 的 少数 是 低 分 ) 。 分 布 B 刚好 左右 尾 相 等 ,而 且 没 有 偏 度 。 如 果 均 值 
大 于 中 位 数 ,就 是 正 偏 度 分 布 。 如 果 中 位 数 大 于 均值 ,就 是 负 偏 度 分 布 。 


分 布 B 

无 偏 度 
分 布 A 分 布 C 
正 偏 度 负 偏 度 


频数 


最 小 值 最 大 值 
图 4.8 不 同 分 布 的 偏 度 
ж Ж 


虽然 这 个 词 听 起 来 像 医 疗 情况 ,但 这 是 我 们 区 分 数据 分 布 相互 区 别 程 
度 的 四 个 方面 的 最 后 一 个 。 峰 度 (kurtosis ) 与 数据 分 布 看 起 来 是 扁平 或 者 陡 
峭 有 关 , 而 且 用 于 描述 这 个 特征 的 概念 是 相对 的 。 例 如 , 低 阔 峰 
(platykurtic) 一 词 是 指数 据 分 布 相对 于 正 态 分 布 或 钟 形 分 布 来 说 十 分 的 局 
平 。 高 狭 峰 (leptokurtic) 一 词 是 指数 据 分 布 相对 于 正 态 分 布 或 钟 形 分 布 来 
说 十 分 的 陡峭 。 在 图 4.9 中 ,数据 分 布 A 与 分 布 B 相 比 是 扁平 的 。 数 据 分 
布 C 与 分 布 B 相 比 是 陡峭 的 。 图 4.9 看 起 来 与 图 4.7 类 似 ,这 是 由 于 一 个 很 
好 的 原因 一 一 例如 低 阔 峰 数据 分 布 比 不 是 低 阔 峰 的 数据 分 布 更 分 散 。 类 似 
地 ,陡峭 峰 数据 分 布 相 对 于 其 他 分 布 来 说 离散 性 或 变异 性 更 小 。 





分 布 C 


频数 


分 布 B 
无 峰 度 


分 布 A 


最 小 值 最 大 值 
4.9 不 同 分 布 的 峰 度 


4 42%%% в, уа 
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现在 偏 度 和 峰 度 是 常用 的 描述 用 语 (例如 ,“ 这 是 负 偏 度 分 
fi”) ,有 一 些 数学 指标 测定 分 布 的 倾斜 或 陡峭 的 程度 。 例 如 , 偏 度 
是 通过 均值 减 去 中 位 数 计 算 。 例 如 数据 分 布 的 均值 是 100 而 中 位 
数 是 95 , 偏 度 值 是 100 -95 =5 ,而 且 这 个 数据 分 布 是 正 偏 度 分 布 。 
如 果 数 据 分 布 均值 是 85 而 中 位 数 是 90 , 偏 度 值 是 85 -90 = -5, 这 
个 数据 分 布 是 负 偏 度 分 布 。 其 实 还 有 更 复杂 的 公式 ,这 个 公式 不 
是 相对 的 ,不 过 因为 考虑 了 数据 分 布 的 标准 差 , 所 以 偏 度 指标 能 够 
相互 比较 ( 见 公式 4.1)。 

sgk -3(Х-М) 


8 


(4.1) 


其 中 

SK 是 皮尔 逊 (他 也 计算 相关 系数 ,你 会 在 第 5 章 了 解 他 ) 偏 度 
量 数 

X 是 均值 

M 是 中 位 数 

使 用 这 个 公式 我 们 能 够 在 绝对 意义 上 而 不 是 相对 意义 上 比较 
不 同 数据 分 布 的 偏 度 。 例 如 数据 分 布 * 的 均值 是 100, 中 位 数 是 
105 ,标准 差 是 10。 数 据 分 布 工 的 均值 是 120 ,中 位 数 是 116 ,标准 
差 是 10。 使 用 皮尔 逊 的 公式 ,分 布 蕊 的 偏 度 是 -1.5, 分 布 了 的 偏 
度 是 1.2。 分 布 X 是 负 偏 度 ,分 布 Y 是 正 偏 度 。 不 管 偏 度 的 方向 如 
何 ,分 布 世 比分 布 工 更 倾斜 。 





其 他 的 图 表 数 据 的 绝妙 方法 


到 现在 为 止 本 章 我 们 所 做 的 就 是 给 出 一 些 数据 ,然后 说 明 如 何 使 用 图 
表 如 直方 图 和 多 边 形 图 来 形象 地 表示 数据 。 但 是 在 行为 和 社会 科学 领域 
还 使 用 一 些 其 他 类 型 的 图 表 , 虽 然 对 你 来 说 没 必 要 确切 地 知道 如 何 建立 这 
些 图 表 ( 手 动 绘制 ) ,但 是 你 至 少 应 该 熟悉 它们 的 名 称 和 应 用 。 因 此 下 面 
介绍 这 些 流行 的 图 表 , 如 何 应 用 以 及 如 何 实现 它们 。 

这 里 有 许多 建立 图 表 的 很 好 的 个 人 电脑 软件 ,其 中 就 有 Excel 电子 数 
据 表 (微软 产品 ) ,当然 还 有 SPSS。 作 为 参考 ,图 4. 10 .图 4.11 与 图 4.12 
是 应 用 Excel 建立 的 图 表 。“ 使 用 计算 机 图 示 数 据 " 部 分 的 图 表 是 使 用 
SPSS 建立 的 。 


柱 形 图 
如 果 你 想 比 较 不 同 分 类 之 间 的 频数 就 应 该 用 柱 形 图 。 分 类 项 在 水 平 轴 
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x 轴 上 显示 ,数值 在 垂直 轴 y 轴 上 显示 。 下 面 的 例子 你 可 能 想 要 使 用 柱 
ЖР: 

е 不 同 政党 背景 的 投票 人 数 

。 不 同 产品 的 销售 量 

e 六 个 不 同年 级 的 学 生 人 数 

4.10 表示 不 同 政党 背景 的 投票 人 数 。 


投票 人 数 
5 


共和 党 民主 党 无 党 派 
图 4.10 比较 不 同 分 类 的 柱 形 图 


条 形 图 


条 形 图 和 柱 形 图 一 样 ,但 是 在 这 个 条 形 图 中 ,分 类 项 在 垂直 轴 y 轴 上 
显示 ,数值 在 水 平 轴 x 轴 上 显示 。 


线 图 


当 你 想 用 相同 的 间距 表示 数据 的 趋势 ,就 用 线 图 。 下 面 的 例子 你 可 能 
想 要 使 用 线 图 : 

° 三 个 州立 大 学 的 大 学 生 中 每 季 出 现 单 核 白血球 增多 症 病案 的 数量 

e 每 学 年 人 学 人 数 的 变化 

。 两 个 航线 每 季 的 旅行 人 数 

在 图 4.11 中 你 可 以 看 到 三 个 州立 大 学 的 大 学 生 中 每 季 汇 报 的 单 核 白 
血球 增多 症 病案 的 数量 的 线 图 ° 





Winter Spring Summer Fall 
季节 


图 4.11 使 用 线 图 表明 数据 随时 间 发 展 的 趋势 
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AZADE a pya 


ян 


如 果 你 想 表 示 组 成 一 系列 数据 点 的 项 目的 比例 ,可 以 使 用 饼 图 。 下 面 
的 例子 你 可 能 想 要 使 用 饼 图 : 

> 生活 贫困 的 儿童 中 各 种 族 的 比例 

° 注册 夜间 部 和 日 间 部 的 学 生 的 比例 

。 不 同性 别 的 参与 者 的 年 龄 分 布 

在 图 4. 12 ,你 可 以 看 到 不 同 种 族 的 生活 贫困 的 儿童 的 数量 的 饼 图 。 


其 他 14% 





黑人 25% 


白人 61% 


图 4.12 说 明 不 同 分 类 项 的 相对 比例 的 饼 图 


使 用 计算 机 图 示 数 据 





现在 我 们 使 用 SPSS ,并 逐步 建立 本 章 讨 论 的 一 些 图 表 。 首 先 
了 解 SPSS 图 表 建 立 的 一 般 规则 。 
1. 要 建立 图 表 , 你 首先 录入 想 要 图 示 说 明 的 数据 ,接着 从 


设置 中 它们 的 称谓 不 同 ) 。SPSS 把 数据 的 形象 表示 叫做 graphs。 


©. Graphs 菜单 选择 你 想 建立 的 图 表 类 型 (看 ,我 已 经 告诉 你 在 不 同 的 





2. 编辑 图 表 , 双击 图 表 本 身 就 会 打开 图 表 编 辑 器 ( Chart Edi- 
tor) 。 编 辑 图 表 直 到 你 看 着 适合 。 
З. 返回 最 初 的 图 表 , 点 击 窗口 左上 角 的 图 标 关闭 图 表 编 辑 器 。 


建立 直方 图 
1 一 录入 你 想 用 于 建立 图 表 的 数据 。 在 这 个 案例 中 ,我 们 使 用 


建立 本 章 开 始 所 示 的 直方 图 所 用 的 相同 数据 。 
2 一 点 击 Graphs 一 Histogram ,你 就 会 看 到 如 下 所 示 的 直方 图 对 


WHE o 
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i Histogram 





图 4.13 直方 图 对 话 框 
3 一 双击 变量 score 将 变量 移 到 Variable ЖЕ, 


4 一 点 击 OK ,就 输出 如 下 所 示 直 方 图 。 


12 


Std.Dev=10.01 
Mean=23.6 
N=50.00 





0.0 5.0 10.0 15.0 20.0 25.0 30.0 35.0 40.0 45.0 


В 4.14 使 用 SPSS 建立 直方 图 





i 
`” 
建立 条 形 图 
依据 下 面 的 步骤 建立 条 形 图 。 输 入 你 想 用 于 建立 图 表 的 数据 。 这 是 
我 们 要 用 的 数据 : 
共和 党 (Republican ) 民主 党 (Democrat ) 无 党 派 ( Independent) 


54 63 19 


50 42%9% a gy% 


1 一 点 击 Graphs 一 Bar ,你 就 会 看 到 条 形 图 对 话 框 。 
2 一 点 击 Summaries for groups of cases ,接着 点 击 Define ,你 就 会 看 到 
图 4.15 所 示 的 对 话 框 。 


\ Define Simple Bar: Summaries for Groups of Cases 





64.15 条 形 图 对 话 框 
3 一 点 击 Other summary function, 
4 一 点 击 变量 number ,接着 点 击 P> 将 变量 移 到 Variable 框 。 
5 一 点 击 变量 party ,接着 点 击 P> 将 变量 移 到 Category Axis HE, 
6 一 点 击 OK ,就 输出 如 下 所 示 条 形 图 。 


70 











Mean Number 
è 








10 


Republican Democrat Independent 


图 4.16 (ЕН SPSS 建立 条 形 图 ( 类 似 于 柱 形 图 ) 
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建立 线 图 


按照 如 下 的 步骤 建立 线 图 : 

1 一 录入 你 想 用 于 建立 线 图 的 数据 。 在 这 个 案例 中 ,我 们 使 用 三 个 
大 学 的 大 学 生 汇 报 的 单 核 白 血球 增多 症 病案 的 数量 。 这 就 是 
数据 : | 

Padukah state Williams state Party U 
59 72 23 





2 一 点 击 Graphs—Line ,你 就 会 看 到 线 图 对 话 框 。 






3 一 点 击 Simple ,接着 点 击 Summaries for groups of cases 
4 一 点 击 Define , 你 就 会 看 到 如 下 所 示 的 Deifine Simple Line :Sum- 
maries for Groups of Cases 对 话 框 。 


Т Summanes for Groups of Сазе: 





84.17 定义 简单 线 图 对 话 框 
5 一 点 击 变 量 Cases , 接着 点 击 Other summary function ,然后 点 击 区 
将 变量 移 到 Variable 框 。 
6 一 接着 将 变量 inst 移 到 Category Axis ЯҒ, 
7 一 点 击 OK ,就 输出 如 下 所 示 线 图 。 


5 42ЖЭ% 过 上 上 统计 学 


Mean CASES 


20 
Padukah State Williams State Party Ú 


图 4.18 三 个 大 学 单 核 白 血球 增多 症 病案 数量 的 线 图 
2 2 4 l 
按照 如 下 步骤 建立 饼 图 。 


1 一 录入 你 想 用 于 建立 饼 图 的 数据 。 在 这 个 案例 中 , 饼 图 用 于 表示 
不 同 种 族 的 生活 在 贫困 状态 的 儿童 的 数量 。 这 就 是 数据 : 





种 族 比例 
白人 (White) 61 
黑人 (了 Black) 25 
其 他 (Other) 14 


2 一 点 击 Graphs 一 Pie ,你 就 会 看 到 饼 图 对 话 框 。 

3 一 点 击 Values of Individual cases 

4 一 点 击 Define。 你 就 会 看 到 Define Pie:Values of individual cases 对 
话 框 。 

5 一 点 击 变量 percent, ЖАЛАҚЫ» 将 变量 移 到 Slices Represent 变 
量 框 。 

6 一 点 击 变 量 Ethnicity ,接着 点 击 P> 将 变量 移 到 Slices Labels 框 。 

7 一 点 击 OK ,就 输出 如 下 所 示人 饼 图 。 
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Black 








White 


4.19 饼 图 一 一 表示 几 个 变量 想 对 于 总 体 的 发 生 比 的 非常 好 的 方法 
МАЗА Se u s 
小 # 
毫 无 疑问 建立 图 表 很 有 趣 , 而 且 能 极 大 地 增加 对 没有 整理 的 数据 的 理解 。 
依据 我 们 在 本 章 给 出 的 建议 可 以 很 好 地 使 用 图 表 , 不 仅 会 而 且 已 经 加 强 了 对 数 
据 的 理解 。 


练习 时 间 

1.50 个 阅读 理解 考试 成 绩 ( 变量 名 comp_sc) 构 成 的 名 称 为 第 4 章 数 据 集 1 
( Chapter 4 Data Set 1) 的 数据 集 可 以 在 网 上 获得 。 回 答 下 面 的 问题 或 完成 下 面 
的 任务 : ; 

a. 建立 这 个 数据 集 的 频数 分 布 和 直方 图 。 

b. 为 什么 选择 你 所 用 的 组 距 ? 
. 这 是 有 偏 度 分 布 吗 ? 你 如 何 知 道 的 ? 
. 针对 下 面 的 每 一 种 情况 ,说 明 你 是 使 用 饼 图 、 线 图 还 是 条 形 图 ? 为 什么 。 
. 某 个 大 学 的 一 年 级 、 二 年 级 、 三 年 级 和 四 年 级 学 生 的 比例 
.四 个 学 期 的 平均 成 绩 (GPA) 的 变化 
. 申请 四 个 不 同 职位 的 人 数 
. 对 不 同 刺 激 的 反应 时 间 
. 10 个 项 目 中 每 一 项 的 得 分 
.去 图 书馆 找 一 篇 你 感 兴趣 的 领域 的 期 刊 文章 ,文章 包含 经 验 数 据 但 是 没 
有 对 数据 的 图 形 表示 。 使 用 这 些 数据 建立 图 表 。 要 确定 你 要 建立 哪 一 类 型 的 图 
表 , 以 及 为 什么 做 出 这 样 的 选择 。 你 可 以 手绘 图 表 , 或 者 使 用 SPSS、Excel 建立 
图 表 。 

4. 建立 你 能 够 建立 的 看 起 来 最 坏 的 图 表 , 如 表格 拥挤 和 文字 无 用 。 没 有 什 
么 东西 能 像 糟糕 的 案例 一 样 令 人 印象 深刻 了 。 


сө Do 


Ó о о 


练习 参考 答案 
1a. 这 就 是 频数 分 布 表 。 


54 ДРАЖА ауы 


8 
RR 
š 
ж 





45 -49 1 
40 ~ 44 2 
35 ~ 39 3 
30 ~ 34 8 
25 ~ 29 10 
20 ~ 24 10 
15 ~ 19 8 
10 ~ 14 4 
5-9 2 
0-4 2 


直方 图 (用 SPSS 完成 ) 应 该 是 这 样 : 


12 


10 


4 

2 
Std. Dev=16.99 
Mean=34.4 

0 М=50.00 


0.0 10.0 20.0 30.0 40.0 50.0 60.0 
5.0 15.0 25.0 35.0 45.0 55.0 


84.20 第 4 章 数据 集 1 的 直方 图 

1b. 我 们 以 组 距 5 建立 直方 图 ,这 样 我 们 就 有 10 个 组 距 ,而 且 也 符合 我 们 本 
章 讨 论 的 决定 组 距 的 标准 。 

1с. 分 布 是 负 偏 度 分 布 , 因 为 均值 小 于 中 位 数 。 

2a. 饼 图 

2b. 线 图 

2c. 条 形 图 

2d. 线 图 

2e. 条 形 图 

3. 自己 来 完成 。 

4. 我 们 使 用 SPSS 和 图 表 编 辑 器 完成 了 这 个 图 一 一 既 难 看 又 没什么 信息 。 


!ISCORES!!! 


图 4.21 


4 





真是 非常 难看 的 图 


Шай УТРЕ: 


Таке а look at this! 


Std.Dev=16.99 
Mean=34.4 
N=50.00 
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冰淇淋 和 犯罪 一 计算 相关 系数 ЕЗ 


本 章 你 会 学 到 什么 


o 什么 是 相关 系数 ,相关 系数 如 何 应 用 
e 如 何 计算 简单 的 相关 系数 

e 如 何 解释 相关 系数 的 值 

e 其 他 类 型 的 相关 系数 


相关 系数 到 底 是 什么 


集中 趋势 量 数 和 变异 性 量 数 不 是 我 们 最 看 好 的 用 于 描述 数据 集 看 起 
来 是 什么 的 唯一 的 描述 统计 。 你 已 经 了 解 ,知道 了 最 具 代 表 性 的 统计 值 
(集中 趋势 ) 和 散布 或 离散 性 (变异 性 ) 量 数 的 值 是 描述 数据 分 布 特征 的 
关键 。 

但 是 ,我 们 有 时 对 变量 之 间 的 关系 感 兴趣 。 或 者 更 精确 地 说 , 当 一 
变量 发 生变 化 时 , 另 一 个 变量 如 何 变化 。 我 们 的 这 种 兴趣 表现 在 计算 简单 
相关 系数 上 。 

相关 系数 ( correlation coefficient ) 是 反映 两 个 变量 之 间 线 性 关系 的 数 
值 性 指标 。 这 个 描述 统计 值 的 值 域 范围 是 -1 到 1。 两 个 变量 的 相关 有 时 
也 叫做 二 元 相关 。 本 章 大 部 分 讨论 的 相关 类 型 是 皮尔 逊 积 距 相关 ( Pear- 
son product-momentcorrelation ) ,是 以 它 的 发 明 者 卡尔 : 皮尔 偿命 名 的 。 


皮尔 撑 相关 系数 考察 两 个 变量 之 间 的 关系 ,但 是 这 些 变量 的 
р 





属性 是 连续 的 。 换 名 话说 ,这 些 变量 可 能 是 某 些 基本 的 连续 体 中 
的 任何 值 ,例如 体重 \ 年 龄 .考试 成 绩 或 收入 。 但 是 大 多 数 其 他 变 
量 是 不 连续 的 。 这 些 变量 叫做 离散 变量 或 者 类 别 变量 ,例如 种 族 
ОН A I A.) 社会 阶级 (如 高 和 低 ) 和 政党 背景 (如 民主 党 和 
共和 党)。 你 需要 使 用 其 他 相关 技术 ,如 这 些 情况 下 要 用 的 点 二 列 
相关 。 这 些 内 容 需 要 更 高 级 的 课程 ,但 是 你 应 该 知道 这 些 技术 非 
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常 有 用 ,也 令 人 满意 。 我 们 在 本 章 后 面 的 部 分 还 会 对 这 些 技 术 进 
行 简 短 讨 论 。 


还 有 其 他 类 型 的 相关 系数 用 于 测量 两 个 以 上 变量 之 间 的 关系 ,而 且 我 
们 会 把 这 些 内 容留 到 下 一 个 统计 课程 (你 现在 已 经 期 望 这 样 的 课程 了 ， 
ХЕ?) 


相关 系数 的 类 型 :选择 1 和 选择 2 


相关 反映 变量 间 关 系 的 动态 性 质 。 这 样 做 可 以 让 我 们 理解 变量 发 生 
变化 时 变化 的 方向 是 相同 还 是 相反 的 。 如 果 变 量变 化 方向 相同 ,相关 是 直 
接 相 关 或 正 相 关 ( direct correlation 或 positive correlation) 。 如 果 变 量变 化 
方向 相反 ,相关 是 间接 相关 或 负 相 关 (indirect correlation 或 negative correla- 
tion)。 表 5.1 给 出 这 些 关 系 的 汇总 。 

表 5.1 相关 关系 的 类 型 和 相应 的 变量 之 间 的 关系 


变量 变量 Y ”相关 关系 的 

的 变化 的 变化 类 型 ка pr 

X {НК Y 值 增 大 ”直接 的 或 正 向 的 ” 正 值 ,(. 00,1. 00) 你 用 于 学 习 的 时 间 越 多 , 考 
试 成 绩 就 会 越 高 。 

XKE ”Y 值 降低 ”直接 的 或 正 向 的 、 正 值 ,(.00,1.00) ”你 在 银行 存 的 钱 越 少 ,所 得 
利息 就 越 少 。 

X 值 增 大 了 Y 值 降低 ”间接 的 或 负 向 的 ” 负 值 ,( -1.00,.00) ”你 运动 越 多 ,体重 就 越 轻 。 

X 值 降低 Y 值 增 大 ”间接 的 或 负 向 的 ” 负 值 ,( -1.00,.00) ”你 完成 考试 的 时 间 越 少 ,所 


犯 的 错误 越 多 。 


现在 要 记 住 表 中 的 例子 反映 的 是 通则 。 例 如 ,考虑 一 次 考试 中 完成 试 
卷 的 时 间 和 答对 的 题目 的 数量 :一 般 来 说 ,一 次 考试 所 用 的 时 间 越 少 成 绩 
越 低 。 

这 样 的 结论 不 是 火箭 科学 ,因为 回答 得 越 快 越 可 能 犯 无 意识 的 错误 ， 
例如 没有 正确 地 阅读 指导 语 。 当 然 也 有 人 既 能 答 得 快 又 能 回答 得 很 好 。 
而 且 也 有 人 虽然 答 得 很 慢 但 是 却 不 能 回答 得 很 好 。 重 要 的 是 ,我 们 讨论 一 
个 群体 在 两 个 变量 上 的 表现 ,是 计算 一 个 群体 的 两 个 变量 之 间 的 相关 ,而 
不 是 对 应 任何 一 个 特定 的 个 人 。 


需要 记忆 的 内 容 


。 相关 系数 的 值 域 范围 是 ( -1,1) 

° 相关 系数 的 绝对 值 反 映 相 关 的 强度 。 因 此 ,相关 系数 -0.70 比 
相关 系数 0.50 表示 的 相关 强度 大 。 在 考虑 相关 系数 时 ,学 生 们 
常 犯 的 一 个 错误 是 ,只 是 因为 符号 的 原因 而 认为 直接 的 或 正 相 


с 这 里 有 许多 与 相关 系数 相关 的 容易 而 重要 的 内 容 。 
Yr 
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关 总 是 比 间接 的 或 负 相 关 强 (例如 “更 好 ”)。 

° 相关 总 是 反映 每 个 案例 至 少 有 两 个 数据 点 (或 变量 ) 的 状况 。 

e 男 一 个 易 犯 的 错误 是 依据 相关 符号 进行 价值 判断 。 许 多 学 生 认 
为 负 相 关 不 好 而 正 相 关 很 好 。 如 果 他 们 仅仅 从 字面 上 理解 ,就 
会 犯 F“ 正 相关 ”总 是 比 “ 负 相关 "更 强 更 好 的 错误 。 

° 皮尔 偿 积 距 相关 系数 用 小 写字 母 r 表示 ,r 的 下 标 表 示 相 关 的 两 
个 变量 。 例 如 ， 

ro 是 变量 X 和 变量 Y 之 间 的 相关 系数 。 

rveiguseisn 是 身高 和 体重 之 间 的 相关 系数 。 

rsurcr 是 学 术 能 力 测验 成 绩 (SAT) 和 平均 成 绩 ( СРА ) 之 间 的 相关 
系数 。 
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相关 系数 反映 两 个 变量 共同 变化 的 程度 。 例 如 ,你 可 以 预期 
一 个 人 的 身高 和 他 的 体重 相关 ,因为 他 们 共享 许多 特征 ,如 个 人 的 
营养 和 医疗 史 ,总 的 健康 状况 和 基因 。 但 是 ,如 果 一 个 变量 值 不 发 
生变 化 ,那么 就 不 存在 什么 共同 的 变异 性 ,也 就 是 两 个 变量 之 间 的 
相关 系数 为 0。 例 如 ,你 计算 年 龄 和 完成 的 就 学 年 限 之 间 的 相关 ， 
而 每 个 人 的 年 龄 是 25 岁 ,那么 这 两 个 变量 之 间 不 相关 ,因为 就 学 
年 限 和 年 龄 之 间 完 全 没有 一 起 变化 的 部 分 (任何 的 变异 性 ) 。 

同样 的 ,如 果 限 制 或 者 控制 一 个 变量 的 值 域 范围 ,这 个 变量 和 
其 他 变量 之 间 的 相关 系数 相对 于 变量 的 值 没 有 限制 的 情况 来 说 会 
更 小 。 例 如 你 计算 成 绩 非常 好 的 学 生 的 阅读 理解 成 绩 和 年 级 之 间 
的 相关 ,你 会 发 现 相 关系 数 小 于 你 从 全 体 学 生计 算得 到 的 同一 相 
关系 数 。 这 是 因为 成 绩 非 常 好 的 学 生 的 阅读 理解 成 绩 也 非常 好 ， 
相对 于 所 有 的 学 生来 说 这 个 成 绩 的 变化 很 小 。 那 么 应 该 怎样 避免 
这 种 情况 ? 如 果 你 对 两 个 变量 之 间 的 关系 感 兴趣 ,就 尽力 收集 充 
分 的 离散 数据 一 一 这 样 你 才 可 以 得 到 最 具 代表 性 的 结果 。 








计算 简单 相关 系数 


公式 5.1 所 示 是 变量 节 与 变量 了 之 间 的 简单 皮尔 逊 积 矩 相关 系数 的 


计算 公式 : 


其 中 


n> XY- Y X> Y 


ry = ———— <  —. n (5229 
n. [55 - єх? | [У ү°-(у у) | 


ryje X 5 Y Z [B] ЯН 
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n 是 样本 规模 

XX 是 变量 XX 的 具体 数值 

Y 是 变量 7 的 具体 数值 

XY 是 每 一 个 值 与 相应 的 了 值 的 乘积 

X° 是 X 值 的 平方 

y 是 了 值 的 平方 

这 是 案例 中 使 用 的 数据 : 
X ү x yá XY 
2 3 4 9 6 
4 1 16 4 8 
5 6 25 36 30 
6 5 36 25 30 
4 3 16 9 12 
7 6 49 36 42 
8 5 64 25 40 
5 4 25 16 20 
6 4 36 16 24 
7 5 49 25 35 

总 计 、 合 计 或 > 54 43 320 201 247 


在 将 数据 代入 公式 之 前 ,我 们 要 确信 你 理解 了 每 一 符号 代表 的 含义 。 
Y XX 或 值 的 总 和 是 54。 

SY 或 Y 值 的 总 和 是 43。 

УХ? 是 每 一 个 X 值 的 平方 的 总 和 ,是 320. 

Y 了 是 每 一 个 Y 值 的 平方 的 总 和 ,是 201。 

Y XY 是 X 和 了 的 乘积 的 总 和 ,是 247。 








按照 下 面 的 步骤 计算 相关 系数 : 

1 一 列 出 每 个 参与 者 的 两 个 数值 。 你 应 该 以 列 的 形式 列 出 以 避免 
混 消 。 

2 一 计算 所 有 XX 值 的 总 和 ,并 计算 所 有 Y 值 的 总 和 。 

3 一 计算 每 个 X 值 的 平方 ,并 计算 每 个 上 值 的 平方 。 

4 一 计算 ХҮ 的 总 和 © 








бө 下 类 方法 в, әм 


将 这 些 值 代入 公式 5.2 的 等 式 中 : 


6 (10 x247) – (54 x43) (5.2) 
” /Гаохз320) -54711(10х201) —437] 


对 啦 ,你 会 在 公式 5.3 中 看 到 答案 : 


8 
= "911283 





= . 692 (5.3) 


相关 的 图 示 表 达 : 散 点 图 


一 种 非常 简单 直观 的 表示 相关 的 方式 是 建立 所 谓 的 散 点 图 (scatter- 
plot) ,或 散布 图 (scattergram ) 。 这 是 数据 集 在 坐标 轴 上 分 布 形成 的 简单 
图 示 。 

我 们 依据 下 面 的 步骤 建立 已 经 计算 了 相关 系数 的 10 对 数值 的 散布 
图 ,如 图 5.1 所 示 。 





图 5.1 简单 的 散 点 图 





1 一 画 出 天 轴 和 了 了 轴 。 一 般 来 说 ,变量 X 在 横 轴 ,变量 了 在 纵 轴 。 

2 一 依据 你 知道 的 数据 标 出 数 轴 的 值 域 范围 。 例 如 ,在 我 们 的 案例 
中 变量 X 的 值 域 范围 是 2 ~ 8 ,因此 我 们 在 蕊 轴 标 出 的 值 域 范围 
是 0~9。 值 域 范围 标注 的 高 一 些 或 低 一 些 没 有 影响 只 要 
你 留 出 数值 能 出 现 的 空间 。 变 量 了 的 值 域 范围 是 2 ~6, 因 此 我 
们 在 工 轴 标 出 的 值 域 范 围 是 0 ~9。 制 作 相似 标签 的 数 轴 有 时 
能 够 使 得 完成 的 散 点 图 更 容易 理解 。 

3 一 最 后 ,对 应 每 对 数值 (例如 图 5.1 中 所 示 的 2 和 3) 我 们 在 图 中 
标注 一 点 ,标注 的 地 方 是 2 对 应 工 轴 3 对 应 了 轴 。 就 如 在 图 
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5.1 中 所 看 到 的 ,点 代表 数据 点 (data point) , 是 两 个 值 的 交 
Lo 


绘 出 了 所 有 的 数据 点 之 后 ,我们 所 做 的 这 个 图 就 能 告诉 我 们 两 个 变量 
之 间 的 关系 。 首 先 ,数据 点 集合 的 形状 表明 了 相关 是 正 向 的 还 是 负 向 的 。 
如 果 一 组 数据 点 形成 的 点 集 是 从 关 轴 和 了 轴 的 左下 角 到 右上 角 , 就 
会 出 现 正 向 的 斜率 。 如 果 一 组 数据 点 形成 的 点 集 是 从 XX 轴 和 了 轴 的 左上 
角 到 右 下 角 , 就 会 出 现 负 向 的 斜率 。 
还 有 一 些 散 点 图 表现 出 非常 不 同 的 相关 ,你 能 看 到 一 组 数据 点 如 何 反 
映 相 关系 数 的 强度 和 方向 。 





图 5.2 完全 的 正 相关 


图 5.2 所 示 是 完全 正 相 关 ,rw =1.00, 而 且 所 有 的 数据 点 排 成 一 条 正 
向 斜率 的 直线 。 

如 果 是 完全 负 相 关 , 相 关系 数值 就 是 — 1. 00 ,而 且 数 据点 也 会 排 成 一 
条 直线 ,但 是 直线 是 从 图 的 左上 角 到 右 下 角 。 换 名 话说 ,连接 数据 点 的 直 
线 的 斜率 是 负 向 的 。 


\d y 


{5 





< 一 -- 


б #2%%*® 2 


图 5.3 中 你 看 到 的 是 正 向 强 相 关 的 散 点 图 ,但 不 是 完全 相关 ,相关 系 
数 rw =.70。 要 注意 的 是 数据 点 沿 着 正 向 的 斜率 排列 , 虽然 不 是 完全 
相关 。 





5.3 正 向 的 强 相关 ,但 不 是 完全 相关 


现在 我 们 向 你 展示 负 向 的 强 相 关 , 如 图 5.4 所 示 的 相关 关系 ,相关 系 


数 rw = -.82。 要 注意 的 是 ,数据 点 如 何 沿 着 负 向 的 斜率 从 左上 角 向 右 下 
角 排 列 。 





85.4 负 向 的 强 相关 关系 


5 ЖАЖЛИПЕ————01ЖИНхЖЖ 63 


这 就 是 不 同 的 相关 类 型 看 起 来 的 样子 ,而 且 你 可 以 依据 数据 点 组 合 的 
方式 大 致 判断 相关 的 一 般 强 度 和 方向 。 


ë KEMA НЕМЕН 28 08А XA Y АЭ Ж REH 
9» (linear correlation) 。 相 关 关 系 可 能 不 是 线性 的 ,而 且 也 可 能 不 是 
6) 





由 直线 反映 的 。 就 如 年 龄 和 记忆 力 之 间 的 相关 。 在 少年 时 期 , 相 
关 可 能 是 很 强 的 正 相关 一 一 儿童 的 年 龄 越 大 ,他 们 的 记忆 力 越 好 。 
接着 ,到 了 青年 和 中 年 时 期 ,没有 太 多 的 变化 或 相关 程度 变化 不 
大 ,因为 大 多 数 青年 人 和 中 年 人 保持 了 良好 的 记忆 力 。 但 是 在 老 
年 时 期 ,记忆 开始 消退 ,而 且 在 老年 时 期 记忆 力 和 年 龄 的 增长 是 负 
相关 关系 。 如 果 你 将 这 些 集 中 起 来 考虑 ,你 会 发 现 记忆 力 和 年 龄 
之 间 的 相关 看 起 来 像 曲 线 , 也 就 是 记忆 力 增 长 ,保持 一 定 水 平 , 接 
着 就 下 降 。 这 是 曲线 相关 ,而 且 有 时 对 这 样 的 关系 的 最 好 的 描述 





就 是 曲线 。 
相关 集 : 1н Z ЖЕ. Ë 
如 果 你 有 两 个 以 上 的 变量 怎么 办 ? 如 何 说 明 相 关 ? 如 下 所 示 的 相关 
矩阵 是 非常 简单 和 有 效 的 解决 方法 。 
收入 教育 态度 选举 
收入 1.00 ‚574 -.08 -.291 
教育 „574 1.00 -.149 -.199 
态度 = 08 -.149 1.00 -.169 
选举 -.291 -.199 -.169 1.00 


ЖАН B H , ЕН pd 4 ЛЕ Е: tk A 2k ЗЕ ( income ) , А zk >F- 
(Educ) .选举 态度 ( Attitude ) 以 及 最 近 的 选举 中 个 人 是 否 参 加 了 选举 
(Мое) 

对 应 每 一 对 变量 都 有 一 个 相关 系数 。 例 如 收入 水 平和 教育 之 间 的 相 
关系 数 是 .574。 类 似 的 ,收入 水 平和 这 个 人 是 否 参 加 最 近 的 选举 的 相关 系 
数 是 - .291( 意 思 是 说 收入 水 平 越 高 ,这 个 人 越 可 能 不 参加 选举 ) 。 

在 这 样 的 矩阵 中 ,总 是 有 41! /(4-2)! 2! 个 相关 系数 ,也 就 是 说 在 4 
个 变量 中 一 次 选择 2 个 总 共 会 有 6 个 相关 系数 。 因 为 变量 和 他 们 自身 完 
全 相关 (也 就 是 沿 着 对 角 线 的 值 都 是 1.00) ,而 且 因 为 收入 和 选举 之 间 的 
相关 系数 与 选举 和 收入 之 间 的 相关 系数 相同 ,矩阵 建立 了 自身 的 镜像 。 

你 在 阅读 应 用 相关 描述 几 个 变量 之 间 的 关系 的 文章 时 就 会 看 到 很 多 
这 样 的 矩阵 。 
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理解 相关 系数 的 含义 


现在 我 们 已 经 有 了 变量 间 关 系 的 数值 指标 ,而 且 我 们 知道 相关 系数 的 
值 越 大 (不 论 正 负 号 ) ,相关 关系 就 越 强 。 但 是 因为 相关 系数 值 不 是 和 结 
果 值 直接 关联 ,那么 我 们 如 何 解释 相关 系数 值 ,并 使 之 成 为 更 有 意义 的 关 
系 指标 ? 

有 几 种 方式 可 以 来 理解 简单 相关 系数 rm。 


使 用 不 成 文 的 规则 


也 许 最 容易 的 (但 不 是 信息 量 最 高 的 ) 解释 相关 系数 值 的 方式 是 看 看 
相关 系数 的 大 小 并 使 用 表 5.2 中 的 信息 。 
表 5.2 解释 相关 系数 


相关 系数 的 大 小 一 般 解 释 
.8-1.0 非常 强 的 相关 
46», 8 强 相关 
.4-.6 中 度 相关 
.2-.4 弱 相 关 
.0-.2 弱 相 关 或 无 关 


因此 ,如 果 两 个 变量 之 间 的 相关 系数 是 .5 ,你 可 以 肯定 地 得 出 结论 , 变 
量 间 的 关系 是 中 度 相 关 一 一 不 是 强 相关 ,也 肯定 不 是 讨论 的 变量 没有 任何 
共同 特征 的 弱 相 关 。 

这 种 浏览 式 方法 非常 适合 快速 的 评价 两 个 变量 之 间 关 系 的 强度 ,就 如 
研究 报告 中 的 描述 部 分 。 但 是 ,因为 不 成 文 的 规则 确实 依赖 主观 判断 ( 什 
么 是 强 相关 "或 “ 弱 相 关 ”) ,我 们 应 该 选择 更 精确 的 方法 。 这 就 是 我 们 将 
要 看 到 的 内 容 。 


决定 性 的 努力 :相关 系数 平方 


更 精确 的 解释 相关 系数 的 方法 是 计算 决定 系数 。 决 定 系数 (coeffi- 
cient of determination ) 是 一 个 变量 的 方差 可 以 被 另 一 个 变量 的 方差 解释 的 
百分比 。 是 不 是 太 难 了 ? 

在 本 章 前 面 的 部 分 我 们 已 经 指出 共享 某 些 特征 的 变量 之 间 如 何 相 关 。 
如 果 我 们 计算 100 个 五 年 级 学 生 的 数学 成 绩 和 英语 成 绩 的 相关 关系 ,我 们 
会 发 现 是 中 度 相 关 , 因 为 数学 好 (或 不 好 ) 的 孩子 的 许多 原因 也 是 他 们 英 
语 好 (或 不 好 ) 的 原因 。 他 们 学 习 的 时 间 、 聪 明 的 程度 、 他 们 的 父母 关注 他 
们 的 学 习 成 绩 的 程度 、 家 里 图 书 的 数量 以 及 更 多 的 方面 都 和 数学 及 英语 成 
绩 有 关 , 而 且 可 以 解释 这 些 孩 子 的 不 同 (这 也 是 变异 性 的 来 源 ) 。 
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这 两 个 变量 共享 的 特征 越 多 ,他 们 就 越 相 关 。 这 两 个 变量 也 共享 变异 
性 一 一 或 者 孩子 们 之 间 存 在 差别 的 原因 。 总 之 ,学 习 越 努力 、 越 聪明 的 孩 
子 成 绩 越 好 。 

决定 系数 的 计算 是 为 了 确定 一 个 变量 的 方差 可 以 被 另 一 个 变量 的 方 
差 解 释 的 程度 ,决定 系数 就 是 相关 系数 的 平方 。 

例如 ,如 果 平 均 成 绩 和 学 习 时 间 之 间 的 相关 系数 是 .70( 或 者 ropa .im = 
.70) ,那么 决定 系数 由 rp .wm 表示 ,是 . 7 或 .49。 这 意味 着 平均 成 绩 方 
差 的 49% 可 以 被 学 习 时 间 的 方差 解释 。 相 关 越 强 , 越 多 的 方差 可 以 被 解释 
(这 很 有 道理 )。 这 两 个 变量 共享 的 特征 越 多 (例如 好 的 学 习习 惯 \ 课 党 能 够 
学 到 的 知识 .没有 压力 ) ,一 个 变量 可 以 更 多 地 解释 另 一 个 变量 表示 出 的 
信息 。 

但 是 ,如 果 49% 的 方差 可 以 被 解释 ,就 意味 着 51% 不 能 被 解释 一 一 因 
此 即使 对 相关 系数 是 . 70 的 强 相 关 来 说 ,也 存在 很 多 无 法 解释 的 原因 导致 
变量 间 的 变化 差异 。 不 能 解释 的 方差 的 数值 就 是 不 相关 系数 (也 叫做 非 
决定 系数 ) 。 这 仅仅 是 不 能 被 X 解释 的 Y 的 方差 的 数量 。 

如 何 形 象 地 表示 共享 方差 的 想法 ? 你 会 在 图 5.5 中 看 到 一 个 相关 系 
数 .对 应 的 决定 系数 ,以 及 表示 两 个 变量 共享 的 方差 多 少 的 图 。 每 个 图 中 
灰色 区 域 越 大 (两 个 变量 共享 的 方差 越 大 ) ,这 两 个 变量 就 越 相关 。 

决定 系数 * 








85.5 变量 如 何 共享 方差 以 及 相应 的 相关 


e 第 一 个 图 中 两 个 圆 没 有 接触 。 他 们 没有 接触 是 因为 他 们 没有 任何 
共享 的 部 分 。 相 关系 数 为 0。 

ө 第 二 个 图 中 两 个 圆 有 重 又 。 相 关系 数 是 .5( 而 且 гу, =.25) ,两 个 变 
量 共 享 25% 的 方差 。 

e 最 后 ,第 三 个 图 中 的 两 个 圆 几 乎 是 一 个 置 于 另 一 个 之 上 。 几 乎 是 完 
全 相关 ,相关 系数 rw =. 9 (пу =. 81) ,两 个 变量 共享 81% 的 方差 。 


冰淇淋 吃 得 越 多 …… 和 犯罪 率 就 越 高 ( 关联 与 因果 关系 ) 
这 是 计算 、 理 解 和 解释 相关 系数 时 需要 注意 的 真正 重要 的 事 。 在 美国 


* (原文 是 非 决定 系数 一 一 译 者 注 ) 


66 42Ж%% argy% 


一 个 中 西部 的 小 镇 ,人 们 发 现 了 一 个 不 符合 逻辑 的 现象 。 地 方 警察 局 局 长 
发 现 冰淇淋 消费 量 越 多 ,犯罪 率 就 越 高 。 这 很 简单 ,如 果 你 测量 这 两 个 变 
ht ,你 会 发 现 这 两 个 变量 的 相关 关系 是 正 向 的 ,也 就 是 人 们 吃 的 冰淇淋 越 
多 ,犯罪 率 就 越 高 。 就 像 你 可 能 预期 的 一 样 , 他 们 吃 的 冰淇淋 越 少 ,犯罪 率 
就 越 低 。 这 个 警察 局 长 很 是 困扰 ,直到 他 回想 起 他 在 大 学 选修 的 统计 学 
课程 。 

他 的 这 个 困惑 最 后 怎么 变 成 了 一 个 “哈哈 ”"! 他 想 这 “非常 容易 ”。 这 
两 个 变量 一 定 是 共享 什么 或 彼此 之 间 有 点 共同 之 处 。 要 记 住 ,一 定 存在 什 
么 变量 同时 和 冰淇淋 消费 水 平和 犯罪 率 水 平 相关 。 你 能 猜 到 是 什么 ? 

室外 温度 是 他 们 共有 的 特征 。 当 室外 气温 变 暖 ,如 在 夏天 ,就 会 有 更 
多 犯罪 (白天 更 长 ,人 们 多 开 窗 户 , 等 等 ) 。 而 因为 天 气 变 暖 ,人 们 更 享受 
吃 冰 淇 淋 的 乐趣 。 相 对 地 ,在 又 长 又 黑暗 的 冬天 岁月 ,冰淇淋 的 消费 就 减 
少 ,同时 犯罪 也 越 少 。 

JF ~ 鲍 勃 (Joe Bob) 近 来 被 选举 为 城市 议员 ,他 知道 了 这 些 发 现 并 且 
有 了 一 个 很 好 的 想法 ,或 者 至 少 他 认为 他 的 选民 会 喜欢 这 个 想法 ( 记 住 ， 
他 忽略 了 大 学 开设 的 统计 学 课程 ) 。 为 什么 不 在 夏天 这 几 个 月 限制 冰 淇 
淋 的 消费 量 ,以 便 使 犯罪 率 下 降 ? 听 起 来 很 合理 ,对 吧 ? 得 啦 ,不 用 进一步 
检验 就 能 知道 ,这 个 结论 根本 没有 意义 。 

这 里 有 一 个 简单 的 原则 , 那 就 是 相关 表示 两 个 或 更 多 变量 之 间 存 在 关 
联 ; 相 关 和 因果 关系 无 关 。 换 句 话 说 ,仅仅 因为 冰淇淋 消费 水 平和 犯罪 率 
一 起 增长 (或 一 起 下 降 ) 并 不 意味 着 一 个 变量 的 变化 会 导致 另 一 个 变量 的 
变化 。 

例如 ,如果 我 们 将 镇 子 里 所 有 商店 的 冰淇淋 拿 走 而 且 不 再 能 得 到 ,你 
认为 犯罪 率 会 下 降 吗 ? 当然 不 会 , 连 这 样 想 都 是 十 分 荒废 的 。 但 是 十 分 奇 
怪 的 是 相关 经 常 这 样 被 解释 一 一 就 好 像 真 的 存在 因果 关系 一 一 而 社会 科 
学 和 行为 科学 的 复杂 问题 就 会 因为 误解 沦落 为 微不足道 的 琐事 。 长 头发 
和 嬉 皮 士 和 越南 战争 有 关 吗 ? 当然 不 是 。 犯 罪 数 量 的 上 升 和 更 有 效 .更 安 
全 的 轿车 有 关 吗 ? 当然 不 是 。 但 是 他 们 都 是 同时 发 生 ,而 且 建 立 了 关联 的 
假象 。 


其 他 重要 的 相关 


评价 变量 的 方式 很 多 。 例 如 定 类 变量 的 属性 是 类 别 的 ,如 种 族 ( 白 人 
或 黑人 ) 或 政党 背景 (无 党 派 或 共和 党 ) 。 或 者 你 测量 收入 和 年 龄 ,两 者 都 
是 定 距 水 平 的 变量 ,因为 作为 它们 建立 基础 的 连续 体 具 有 相等 的 间距 。 当 
你 继续 研究 ,你 可 能 遇 到 发 生 在 不 同 测量 水 平 之 间 的 数据 的 相关 。 而 要 计 
算 这 样 的 相关 你 需要 一 些 特殊 的 技术 。 表 5.3 汇总 了 这 些 不 同 的 技术 以 
及 他 们 如 何 相互 区 别 。 
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表 5.3 相关 系数 展示 , 选 哪 一 个 ? 








测量 水 平和 案例 
ЖЕ X 变量 了 相关 类 型 要 计算 的 相关 
定 类 的 (选举 偏好 ,如 共 ” 定 类 的 (性 别 ,如 男 ” 卡 方 系数 选举 偏好 和 性 别 之 
和 党 或 民主 党 ) 性 或 女性 ) 间 的 相关 
定 类 的 (社会 阶层 ,如 上 ” 定 序 的 (高 中 毕业 班 ”等 级 二 列 相关 系数 ”社会 阶级 和 在 高 中 学 
层 .中 层 或 下 层 ) 的 排序 ) 校 排序 之 间 的 相关 
定 类 的 (家 庭 结 构 , 如 双 ” 定 距 的 (平均 成 绩 ) 点 二 列 相关 系数 家 庭 结 构 和 平均 成 
亲家 庭 或 单亲 家 庭 ) 绩 之 间 的 相关 
定 序 的 (转换 为 排序 的 ” 定 序 的 (转化 为 排序 ”斯 皮尔 曼 等 级 相关 身高 和 体重 之 间 的 
身高 ) 的 体重 ) 系数 相关 
定 距 的 (解决 的 问题 数 定 距 的 (以 年 计 的 ”皮尔 逊 相关 系数 解决 的 问题 数量 和 
量 ) 年 龄 ) 以 年 计 的 年 龄 之 间 
的 相关 
使 用 计算 机 计算 相关 系数 
现在 我 们 使 用 SPSS 计算 相关 系数 。 我 们 使 用 的 数据 集 是 名 
称 为 第 5 章 数 据 集 1(Chapter 5 Data Set 1) 的 SPSS 数据 集 文 件 。 
这 个 数据 集中 有 两 个 变量 : 
变量 定义 
收入 (income ) 以 千 计 的 年 收入 
教育 (educ) 以 年 计 的 教育 水 平 
依据 下 面 的 步骤 计算 皮尔 逊 相关 系数 : 


1. 打开 名 称 为 第 5 章 数据 集 1(Chapter 5 Data Set 1) 的 文件 。 

2. 点 击 Analyze—Correlate— Bivariate ,你 就 会 看 到 图 5.6 中 所 
示 的 Bivariate: Correlations 对 话 框 。 

3. 双击 变量 income 将 变量 移 到 Variables ЖЕ, 

4. 双击 变量 educ 将 变量 移 到 Variables 框 。 

5. 点 击 ОК, 
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‚ Bivariate Correlations 
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图 5.6 确定 用 于 计算 相关 系数 的 变量 
SPSS 输出 结果 


图 5.7 中 的 输出 结果 显示 相关 系数 等 于 . 574。 也 表明 样本 规 
模 是 20 ,以 及 相关 系数 的 统计 显著 性 测量 指标 (我 们 会 在 第 13 ж 
讨论 ) 。 


Pearson Correlation .574(жж) 
Sig. (2-tailed) .008 


N 20 
Pearson Correlation 1 
бір. (2-tailed ) 
N 20 
ж ж Correlation is significant at the 0. 01 level (2-tailed). 





图 5.7 相关 系数 计算 的 SPSS 输出 结果 
建立 一 个 SPSS 散 点 图 (或 散布 图 ,或 其 他 ) 


你 可 以 建立 图 5. 1 中 所 见 的 散 点 图 ,但 是 对 你 来 说 知道 如 何 
应 用 SPSS 建立 散 点 图 也 很 好 。 让 我 们 使 用 之 前 用 于 建立 图 5.7 
中 看 到 的 相关 和 矩阵 的 相同 的 数据 建立 散 点 图 。 首 先 要 确定 第 5 章 
数据 集 1( Chapter 5 Data Set 1) 出 现在 你 的 电脑 屏幕 上 。 

1. 点 击 Graphs 一 *Scatter。 


INCOME 


20 000 


10 000 
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2. 点 击 Simple ,接着 点 击 Define ,你 会 看 到 图 5. 8 中 的 Simple 
Scatterplot 对 话 框 。 | 





5.8 使 用 SPSS 建立 简单 的 散 点 图 


3. 点 击 变量 income ,接着 点 击 隐 将 变量 移 到 Y Axis 框 。 
4. 点 击 变量 educ ,接着 点 击 隐 将 变量 移 到 X Axis ЯҒ, 
5. 点 击 OK ,你 会 看 到 图 5.9 中 所 示 的 散 点 图 。 


EDUC 


图 5.9 简单 的 散 点 图 
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0-0 U БНР ИАР ГА ЦИ 
小 结 

表明 一 个 变量 和 另 一 个 变量 如 何 相 关 以 及 他 们 共有 什么 特征 的 想法 是 非常 
有 影响 的 想法 ,也 是 非常 有 用 的 描述 统计 (也 在 推论 统计 中 使 用 ) 。 要 记 住 的 是 ， 
相关 表明 的 关系 仅仅 是 关联 的 ,但 不 是 因果 的 。 如 果 你 能 够 理解 这 项 统计 如 何 
就 变量 间 的 关系 给 我 们 提供 了 有 意义 的 信息 ,以 及 一 个 变量 在 另 一 个 变量 变化 
时 如 何 变化 或 保持 不 变 , 那 么 现在 是 时 候 开 始 学 习 第 亚 部 分 * ,也 就 是 包括 概率 
和 假设 检验 在 内 的 推论 统计 的 概念 基础 。 


练习 时 间 
1. 使 用 这 些 数 据 回 答 问题 la 和 1b。 这 些 数据 的 数据 集 名 称 为 第 5 ж & TE 
Ж 2( Chpater 5 Data Set 2) 。 


на Аы 
(20 个 问题 之 中 ) 回答 正确 的 总 数 对 考试 的 态度 ( 总 分 是 100) 
17 94 
13 73 
12 59 
15 80 
16 93 
14 85 
16 66 
16 79 
18 77 
19 91 


а. 手动 计算 皮尔 迁 积 距 相 关系 数 ,并 记 下 所 有 的 过 程 。 

b. 手动 建立 这 10 对 数据 的 散 点 图 。 依 据 散 点 图 是 否 可 以 预测 相关 是 正 向 
的 还 是 负 向 的 ? 为 什么 ? 

2. 使 用 下 面 的 数据 回答 问题 2a 和 2b。 


( 游 完 50 码 ) 速 度 力量 (推举 的 重量 级 ) 
21.6 135 
23.4 213 
26.5 243 
25.5 167 
20.8 120 
19.5 134 
20.9. 209 
18.7 176 
29.8 156 


28.7 | 177 
— — ——— .. . C C C CMD 


* 原文 为 第 部 分 。 一 一 译 者 注 
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a. Ж J| TF Ж #& Ж TF ЖАЛ. АНК Ж. 

b. 使 用 相关 系数 从 最 弱 到 最 强 的 值 域 范 围 来 解释 数据 ,并 计算 决定 系数 。 
主观 分 析 和 rr 值 比较 结果 如 何 ? 

3. 两 个 变量 之 间 的 决定 系数 是 .64, 回 答 下 面 的 问题 : 

а. 皮尔 逊 相关 系数 是 多 少 ? 

b. 相关 关系 的 强度 如 何 ? 

c. 两 个 变量 的 关系 中 方差 不 可 解释 的 部 分 是 多 少 ? 

4. 看 图 5.3, 你 是 用 什么 类 型 的 相关 系数 检验 种 族 ( 定 义 为 不 同 的 类 别 ) 和 和 
政党 背景 的 关系 ? 是 否 是 俱乐部 成 员 ( 是 或 不 是 ) 和 高 中 平均 成 绩 之 间 的 关系 
R? 解释 你 为 什么 选择 这 样 的 答案 。 


练习 参考 答案 
la. г=: 596 
lb. 依据 la 的 答案 ,你 已 经 知道 相关 是 正 向 的 。 但 是 依据 图 5.10 中 所 示 的 
散 点 图 (我 们 使 用 SPSS ,但 是 你 应 该 手动 绘制 ) ,你 可 以 预测 这 样 的 结论 (即使 实 
际 并 不 知道 相关 系数 的 正 负 号 ), 因 为 数据 点 集合 本 身 是 从 图 的 左下 角 到 右上 
角 , 可 以 假定 是 正 斜 率 。 


20 


50 60 70 80 90 100 


ATT 
图 5.10 数据 集 2 的 散 点 图 
2а. г-.269. 
2b. 依据 这 一 章 之 前 提供 的 图 表 , 这 个 规模 的 相关 强度 是 弱 相 关 。 决 定 系 数 
是 .269” ,或 者 方差 的 7.2% (. 072) 可 以 得 到 解释 。 主 观 分 析 ( 弱 相 关 ) 和 客观 数 


72 ДРАЖА мм 
值 (可 解释 方差 的 7.2% ) 一 致 。 

238, . 8 

3b. 非常 强 。 

Зс. 1 –.64, 36%(.36). 

4. 你 应 该 使 用 卡 方 系数 检验 种 族 和 政党 背景 的 关系 ,因为 这 两 个 变量 的 属 
性 是 定 类 的 。 你 应 该 使 用 点 二 列 相 关系 数 检验 俱乐部 成 员 身 份 和 高 中 平均 成 绩 
(GPA) 的 关系 ,因为 这 两 个 变量 的 属性 一 个 是 定 类 的 (俱乐部 成 员 身 份 ) 5 — À 
Ж Е HE by (GPA), 


samd d EEREN, 


ONAA A 
ах SS : 
x 


C0 
S= 


РТ 7. 
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第 下 部 分 
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到 目前 为 止 你 了 解 了 什么 , 接 下 来 又 会 学 什么 呢 ? 首先 ,你 已 经 具备 了 如 何 
描述 一 组 数据 的 特征 以 及 数据 分 布 如 何 区 别 的 坚实 基础 。 这 是 你 在 4《 爱 上 统计 
学 ) 第 2 章 、 第 3 章 和 第 4 章 学 到 的 内 容 。 在 第 5 章 你 也 学 了 如 何 使 用 相关 工具 
描述 变量 间 关 系 。 

现在 是 加 大 赌注 真正 开始 玩 儿 的 时 候 了 。 在 《 爱 上 统计 学 > 第 焉 部 分 ,第 6 
章 向 你 介绍 假设 检验 的 重要 性 和 性 质 , 包 括 对 假设 检验 是 什么 有 几 种 不 同 的 类 
型 、 假 设 的 功能 以 及 假设 为 什么 和 如 何 被 检验 的 深度 讨论 。 

接着 ,我 们 通过 讨论 正 态 曲线 说 明 概 率 的 所 有 重要 方面 ,以 及 作为 概率 基础 
的 基本 原则 ,作为 统计 学 的 一 部 分 ,概率 能 帮助 我 们 定义 某 类 事件 (如 一 次 考试 
中 的 特定 值 ) 发 生 的 可 能 性 。 我 们 将 使 用 正 态 曲线 作为 这 些 讨论 的 基础 ,而 且 你 
会 看 到 一 个 数据 分 布 中 任何 数值 或 事件 的 发 生 具 有 与 概率 一 致 的 可 能 性 。 

带 着 乐趣 学 习 了 概率 和 正 态 曲线 之 后 ,我 们 准备 在 第 信 部 分 开始 更 进一步 
的 讨论 ,主要 是 依据 假设 检验 和 概率 论 的 应 用 来 检验 有 关 变 量 间 关系 的 特定 问 
题 。 从 现在 开始 只 会 越 来 越 好 。 


你 和 假设 :检验 你 的 问题 G 


本 章 你 会 学 到 什么 


e 样本 和 总 体 之 间 的 差异 
e 零 假 设 和 研究 假设 的 重要 性 
° 判断 一 个 好 假设 的 标准 


也 许 你 想 成 为 一 个 科学 家 


你 可 能 已 经 在 其 他 的 课程 中 听 到 了 假设 这 个 词 。 你 甚至 不 得 不 为 了 
你 在 其 他 课 上 所 做 的 研究 建立 一 个 假设 ,或 者 你 在 期 刊 文章 中 已 经 看 到 过 
一 两 次 。 如 果 是 这 样 ,你 可 能 对 假设 是 什么 已 经 有 了 很 好 的 认识 。 对 于 你 
们 中 不 熟悉 这 个 词 的 人 来 说 ,假设 (hypothesis) 基本 上 是 “学 术 猜 测 ”。 假 
设 最 重要 的 角色 是 表示 一 般 问题 的 陈述 ,或 在 最 初 的 时 候 促 使 人 们 去 探索 
研究 的 问题 。 

这 就 是 为 什么 花费 精力 和 时 间 去 建立 一 个 简要 和 清晰 的 研究 问题 是 
如 此 重要 的 原因 。 研 究 问题 是 建立 假设 的 指导 ,相应 的 假设 决定 你 用 于 检 
验 假设 以 及 回答 最 初 提出 的 问题 的 技术 。 

因此 ,一 个 好 的 假设 将 问题 陈述 或 研究 问题 转换 为 更 适合 于 检验 的 形 
式 。 这 种 形式 就 叫做 假设 。 我 们 将 在 本 章 后 面 的 部 分 讨论 如 何 才能 建立 
一 个 好 的 假设 。 在 这 之 前 ,我 们 的 注意 力 会 转向 样本 和 总 体 的 差异 。 这 是 
重要 的 区 别 , 因 为 假设 检验 是 用 于 样本 ,然后 才 将 结论 一 般 化 到 更 大 的 总 
体 。 接 着 将 注意 力 转向 假设 的 两 个 主要 类 型 ( 零 假 设 和 研究 假设 ) 。 现 在 
首先 让 我 们 给 在 《 爱 上 统计 学 》 前 面 章节 用 到 的 一 些 简单 的 术语 做 正式 的 


样本 和 总 体 


作为 一 个 好 的 科学 家 , 你 可 能 会 说 如 果 方 法 A 比方 法 B 好 ,这 是 永 
远 、 一 直 而 且 对 宇宙 所 有 人 都 正确 的 ,对 吗 ? 实际 上 如 果 你 依据 方法 A 和 
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方法 В 相应 的 优点 进行 足够 的 研究 ,并 检验 了 足够 的 总 体 ,你 总 有 一 天 会 
这 样 说 。 但 是 不 要 太 激 动 , 因 为 你 不 可 能 如 此 确信 地 这 样 说 。 这 会 花费 太 
多 的 钱 ($$$ ) 和 太 多 的 时 间 ( 用 所 有 的 人 ) 来 做 那些 研究 ,另外 这 甚至 是 
不 必要 的 。 相 反 你 只 要 从 总 体 中 选择 一 个 代表 性 样本 ,并 且 检 验 有 关 方 法 
А 和 方法 B 的 假设 。 

几乎 所 有 的 科学 家 都 受到 没有 足够 的 时 间 和 足够 的 研究 基金 的 限制 ， 
所 以 最 好 的 策略 是 从 一 个 较 大 总 体 中 选取 一 部 分 ,并 在 这 个 较 小 的 群体 中 
进行 研究 。 在 这 种 情况 下 , 较 大 的 群体 作为 局 体 (atom 从 这 个 总 体 
中 选择 的 较 小 群体 就 是 样本 (sample) 。 


:6; 测量 样本 和 总 体 特征 近似 程度 的 量 数 叫做 抽样 误差 (sampling 

A error) 。 抽 样 误差 基本 上 就 是 样本 统计 值 和 总 体 参数 之 间 的 差异 。 
抽样 误差 越 大 ,抽样 过 程 中 的 精确 性 越 低 , 且 应 用 样本 中 的 发 现 真 
实 反 映 总 体 中 预期 发 现 就 更 加 困难 。 








样本 应 该 以 这 样 的 方式 从 总 体 中 选取 ,就 是 样本 要 尽 可 能 和 总 体 的 特 
征 匹配 。 目 标 就 是 使 得 样本 尽 可 能 地 类 似 总 体 。 保 证 这 两 个 群体 类 似 的 
最 重要 的 应 用 是 基于 样本 的 研究 结论 可 以 一 般 化 到 总 体 。 如 果 样 本 确实 
代表 了 总 体 ,就 可 以 说 研究 结论 具有 很 高 的 一 般 化 水 平 。 


= R iz 


好 吧 ,我 们 已 经 从 总 体 中 选择 了 一 个 样本 来 检验 我 们 的 研究 假设 ,我 
们 首先 要 建立 零 假设 (null hypothesis) 。 

零 假设 非常 有 趣 。 如 果 它 能 讲话 ,一 定 会 说 类 似 这 样 的 话 ,“ 我 代表 
你 们 正在 研究 的 两 个 变量 无 关 ” 。 换 句 话 说 , 零 假设 就 是 可 以 由 下 面 一 些 
取 自 非常 流行 的 社会 和 行为 科学 期 刊 的 真实 的 (简短 的 ) 零 假设 说 明 的 等 
价 命题 。 为 了 保护 个 人 隐私 我 们 改变 了 名 称 。 


° 9 年 级 学 生 的 ABC 记忆 考试 的 平均 成 绩 和 12 年 级 学 生 的 平均 成 绩 
没有 差异 。 

e 由 社区 长 期 照料 老人 的 效率 和 由 家 庭 长 期 照料 老人 的 效率 没有 
差异 。 

о 反应 时 间 和 问题 解决 能 力 无 关 。 

° 白人 家 庭 和 黑人 家 庭 提供 给 孩子 的 与 学 校 活 动 有 关 的 支持 在 数量 
上 没有 差异 。 


这 四 个 假设 的 共同 之 处 在 于 他 们 都 宣称 两 个 或 多 个 事物 之 间 是 等 同 
的 或 没有 关系 的 。 
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ааа адну 


零 假设 的 目的 


零 假设 的 基本 目的 是 什么 ? 零 假设 既是 研究 起 点 也 是 测量 实际 的 研 
究 结果 的 基准 。 

现在 让 我 们 更 详细 地 讨论 每 一 个 目的 。 

首先 , 零 假设 是 研究 的 起 点 ,因为 在 没有 其 他 信息 的 情况 下 零 假 设 就 
被 看 作 可 接受 的 真实 状态 。 例 如 ,我 们 上 面 给 出 的 第 一 个 零 假 设 : 


9 年 级 学 生 的 ABC 记忆 考试 的 平均 成 绩 和 12 年 级 学 生 的 平均 成 绩 没 
有 差异 。 


如 果 对 9 年 级 和 12 年 级 学 生 的 记忆 技能 没有 更 多 了 解 ,就 没有 理由 
相信 这 两 个 群体 之 间 存 在 差异 ,对 吧 ? 如 果 对 变量 间 的 关系 没有 任何 了 
解 ,你 能 做 的 最 好 的 就 是 去 猜测 。 这 就 要 承担 一 定 的 风险 。 你 可 能 对 一 个 
群体 为 什么 比 另 一 个 群体 做 得 好 做 出 猜测 ,但 是 你 没有 先 验 的 (在 事实 之 
前 ) 证 明 , 那 么 除了 假定 他 们 是 相同 的 之 外 还 有 什么 选择 ? 

不 存在 某 种 关系 作为 研究 的 起 点 是 整个 主题 的 重点 。 换 句 话 说 ,直到 
你 能 证 明 存 在 差异 ,否则 你 只 能 假定 没有 差异 。 而 无 差异 或 无 关 的 陈述 正 
是 零 假设 的 所 有 内 容 。 

进一步 讲 , 如 果 这 两 个 群体 之 间 存 在 任何 差异 ,你 必须 假定 这 些 差 异 
是 出 于 偶然 ,这 是 对 任何 两 个 群体 之 间 在 任何 变量 上 的 差异 的 最 有 吸引 力 
的 解释 一 一 存在 偶然 性 ! 这 是 对 的 ,如 果 没 有 其 他 信息 ,偶然 性 总 是 对 观 
察 到 的 群体 之 间 的 差异 或 变量 之 间 的 关系 的 最 可 能 和 最 有 吸引 力 的 解释 。 
偶然 性 解释 我 们 不 能 解释 的 差异 。 你 可 能 已 经 把 偶然 性 看 作 是 在 游戏 机 
上 赢得 5 000 美元 大 奖 的 几率 ,但 是 我 们 讨论 的 偶然 性 完全 是 其 他 的 “ 事 
物 ”, 它 掩盖 事实 ,甚至 使 得 理解 变量 间 关 系 的 “真实 ”性 质变 得 更 困难 。 

例如 ,你 选取 了 一 组 橄榄 球 队 员 和 一 组 足球 队员 来 比较 他 们 的 跑步 速 
度 。 但 是 要 考虑 所 有 我 们 不 知道 的 可 能 导致 速度 差异 的 因素 。 有 谁 知道 是 
否 一 些 橄榄 球 队员 进行 了 更 多 的 练习 ,或 者 一 些 足球 队员 更 强壮 ? 或 者 两 
组 队员 都 接受 了 额外 的 训练 ? 更 重要 的 是 ,也 许 测定 他 们 速度 的 方式 本 身 
就 有 很 大 的 偶然 性 ;出 问题 的 秒表 或 大 风 天 可 能 导致 了 与 真实 速度 无 关 的 
差异 。 作 为 好 的 研究 者 ,我 们 的 工作 是 解释 观察 到 的 差异 时 消除 偶然 性 因 
素 ,并 评价 其 他 可 能 导致 群体 差异 的 因素 ,例如 有 目的 的 训练 或 营养 计划 ， 
并 分 析 这 些 因 素 如 何 影 响 速 度 。 重 点 是 如 果 我 们 发 现 群体 间 的 差异 并 且 差 
异 不 是 由 于 训练 引起 的 ,我 们 就 很 难 将 差异 归结 为 偶然 性 之 外 的 其 他 因素 。 

零 假设 的 第 二 个 目的 是 提供 与 观察 到 的 结果 进行 比较 的 基准 ,进而 分 
析 是 否 是 由 于 其 他 因素 引起 这 些 差 异 。 零 假设 有 助 于 定义 观察 到 的 群体 
间 的 差异 范围 是 由 偶然 性 引起 (这 是 零 假设 的 论点 ) 还 是 由 偶然 性 之 外 的 
因素 (这 可 能 是 其 他 变量 影响 的 结果 ,例如 上 个 例子 中 的 训练 ) 引 起 。 

许多 的 研究 暗含 着 零 假设 ,而 你 不 能 在 报告 和 期 刊 文章 中 清楚 地 发 现 
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零 假 设 的 表述 。 但 是 你 会 发 现 明确 表述 的 研究 假设 ,这 是 我 们 接 下 来 要 关 
注 的 内 容 。 


研究 假设 


零 假 设 是 变量 间 无 关 的 陈述 ,而 研究 假设 (research hypothesis ) 是 变量 
间 有 关系 的 明确 陈述 。 例 如 对 于 之 前 陈述 的 每 一 个 零 假 设 ,都 有 一 个 对 应 
的 研究 假设 。 注 意 我 们 说 到 相应 的 研究 假设 时 用 的 是 “不 定 冠 词 ” 而 不 是 
“ 定 冠 词 ” ,因为 对 任何 一 个 零 假设 来 说 肯定 存在 不 止 一 个 研究 假设 。 


69 年 级 学 生 的 ABC 记忆 考试 的 平均 成 绩 不 同 于 12 年 级 学 生 的 平均 
成 绩 。 

° 依据 玛 格 奥 莱 斯 社会 活动 量 表 的 测量 ,社区 长 期 照料 老人 的 效果 不 
同 于 家 庭 长 期 照顾 老人 的 效果 。 

o 较 慢 反应 时 间 和 问题 解决 能 力 正 相关 。 

° 白人 家 庭 和 黑人 家 庭 提供 给 孩子 教育 活动 方面 的 支持 在 数量 上 有 
差异 。 


这 四 个 研究 假设 有 一 个 共同 的 方面 。 他 们 都 是 不 等 价 的 陈述 。 他 们 
假定 变量 间 存 在 一 定 的 关系 ,而 不 是 零 假 设 假 定 的 等 价 的 关系 。 

不 等 价 关 系 可 以 采取 两 种 形式 一 一 有 方向 研究 假设 和 无 方向 研究 假 
设 。 如 果 研 究 假设 假定 不 等 价 关 系 没有 方向 (例如 “不 同 于 ”) ,假设 就 是 
无 方向 研究 假设 。 如 果 研 究 假设 假定 不 等 价 关 系 有 方向 (例如 “多 于 ?或 
“ 少 于 ”) ,这 个 研究 假设 就 是 有 方向 研究 假设 。 


无 方向 研究 假设 


无 方向 研究 假设 (nondirectional research hypothesis ) 反映 群体 间 的 差 
ЭЯ ,但 是 差异 的 方向 是 不 确定 的 。 

例如 研究 假设 

9 年 级 学 生 的 ABC 记忆 考试 的 平均 成 绩 不 同 于 12 年 级 学 生 的 平 

23) 成绩 
是 无 癌 的 ,也 就 是 两 个 群体 间 差 异 的 方向 不 确定 。 假 设 只 是 陈述 存在 差 
异 ,但 没有 陈述 差异 的 方向 。 因 为 差异 是 假设 的 所 以 是 研究 假设 ,但 是 差 
异 的 性 质 不 确定 。 

这 里 描述 的 假设 是 无 方向 研究 假设 ,可 以 用 下 面 的 式 子 表示 。 

Н,:Х,»<Х,, (6.1) 


其 中 
Н, 表示 第 一 个 (可 能 有 几 个 ) 研究 假设 的 符号 
X, 表示 9 年 级 学 生 样本 的 平均 记忆 成 绩 
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Z23738 爱 上 统计 学 
X ,表示 12 年 级 学 生 样本 的 平均 记忆 成 绩 
和 天 表示 “不 等 于 ” 


有 方向 研究 假设 


有 方向 研究 假设 (directional research hypothesis ) 反映 群体 间 的 差 ЯҒ; 
而 且 差 异 的 方向 是 确定 的 。 
例如 研究 假设 


12 年 级 学 生 的 ABC 记忆 考试 的 平均 成 绩 比 9 年 级 学 生 的 平均 成 绩 高 


是 有 向 的 ,因为 两 个 群体 间 差 异 的 方向 是 确定 的 。 一 个 被 假设 大 于 (不 仅 
仅 是 不 同 ) 另 一 个 。 
其 他 两 个 有 方向 假设 的 案例 是 : 


A 大 于 B( 或 A>B), 或 B 大 于 A( 或 B>A) 


这 两 个 假设 由 于 特定 的 性 质 (大 于 或 小 于 ) 都 表示 不 相等 。 上 面 描述 
的 12 年 级 学 生 的 成 绩 比 9 年 级 学 生 的 成 绩 好 的 假设 是 有 方向 研究 假设 ， 
可 以 用 下 面 的 式 子 表示 : 


Н.Х зл, (6.2) 


其 中 

H, 表示 第 一 个 (可 能 有 几 个) 研究 假设 的 符号 

Х, 表示 9 年 级 学 生 样 本 的 平均 记忆 成 绩 

Х,% 512 年 级 学 生 样本 的 平均 记忆 成 绩 

> 表示 “大 于 ” 

研究 假设 的 目的 是 什么 ”直接 检验 的 研究 假设 是 研究 过 程 中 的 重要 
一 步 。 通 过 比较 检验 的 结果 与 随机 预期 的 结果 (也 就 是 零 假设 ) 来 确定 这 
两 个 中 哪 一 个 是 你 观察 到 的 群体 间 差异 的 更 好 的 解释 。 

下 面 是 4 个 零 假 设 和 相应 的 有 方向 研究 假设 和 无 方向 研究 假设 。 

表 6.1 零 假设 和 相应 的 研究 假设 





零 假 设 


9 年 级 学 生 的 ABC 记忆 考试 的 
平均 成 绩 和 12 年 级 学 生 的 平 
均 成 绩 没 有 差异 。 


依据 玛 格 奥 莱 斯 社会 活动 量 表 
的 测量 ,社区 长 期 照料 老人 的 
效果 和 家 庭 长 期 照顾 老人 的 效 
果 没 有 差异 。 


无 方向 研究 假设 


12 年 级 学 生 的 ABC 记忆 考试 
的 成 绩 不 同 于 9 年 级 学 生 的 
成 绩 。 


依据 玛 格 奥 莱 斯 社会 活动 量 表 
的 测量 ,社区 长 期 照料 老人 的 
效果 不 同 于 家 庭 长 期 照顾 老人 
的 效果 。 


有 方向 研究 假设 
12 年 级 学 生 的 АВС 记忆 考 
试 的 平均 成 绩 高 于 9 年 级 学 
生 的 平均 成 绩 。 


依据 玛 格 奥 莱 斯 社会 活动 量 
表 的 测量 ,社区 长 期 照料 老 
人 的 效果 高 于 家 庭 长 期 照顾 
老人 的 效果 。 
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续 表 
Ый 无 方向 研究 假设 有 方向 研究 假设 
反应 时 间 和 问题 解决 能 力 ”反应 时 间 和 问题 解决 能 力 有 反应 时 间 和 问题 解决 能 力 之 
无 关 。 关系 。 间 正 相关 。 
白人 家 庭 提 供给 孩子 的 支持 数 ”白人 家 庭 提供 给 孩子 的 支持 
HARADI 不同 于 黑人 家 庭 提供 的 支持 ”数量 高 于 黑人 家 庭 提 供 的 支 
子 的 支持 数量 没有 差异 。 
数量 。 持 数量 。 
讨论 有 方向 和 无 方向 假设 的 另 一 种 方式 就 是 讨论 单 尾 和 双 尾 
@ 检验 。 单 尾 检验 (one-tailed test 反映 有 方向 假设 ) 假定 了 特定 方向 
“> 的 差异 ,如 我 们 假设 群体 1 的 得 分 比 群体 2 高 。 双 尾 检验 (two- 
b tailed test 反映 无 方向 假设 ) 假定 差异 没有 特定 的 方向 。 如 果 你 想 


检验 不 同类 型 的 假设 ( 单 尾 和 双 尾 的 检验 ) ,建立 拒绝 或 接受 零 假 2 
设 的 概率 水 平 ,这 个 区 别 就 十 分 重要 。 在 第 10 章 会 有 更 多 的 讨 
论 。 我 保证 。 


研究 假设 和 零 假设 的 一 些 区 别 


除了 零 假设 表示 等 价 关 系 而 研究 假设 表示 不 等 价 关 系 之 外 ,这 两 类 假 
设 还 有 几 个 重要 的 不 同 之 处 。 

首先 ,简短 地 回顾 一 下 ,两 类 假设 的 区 别 在 于 一 个 ( 零 假 设 ) 表 示 两 个 
变量 之 间 没 有 关系 (相等 ) ,而 另 一 个 (研究 假设 ) 表 示 两 个 变量 之 间 有 关 
系 ( 不 相等 ) 。 这 是 基本 的 区 别 。 

其 次 , 零 假 设 总 是 对 应 总 体 , 而 研究 假设 总 是 对 应 样本 。 我 们 从 一 个 
较 大 的 总 体 中 选择 一 个 样本 。 接 着 我 们 试图 将 样本 的 结论 一 般 化 到 总 体 
中 。 如 果 你 还 记得 基本 的 哲学 和 逻辑 原理 (你 已 经 上 过 了 这 些 课 , 对 
吧 ?) ,就 会 知道 从 一 个 小 群体 (如 样本 ) 到 一 个 大 群体 (如 总 体 ) 过程 就 是 
推论 。 

第 三 ,因为 总 体 不 能 直接 进行 检验 (再 说 一 次 ,这 是 不 现实 \ 不 经 济 
的 ,而 且 通 常 是 不 可 能 的 ) ,你 不 能 百分之百 肯定 地 说 样本 之 间 在 某 些 变 
量 上 真 的 不 存在 区 别 。 另 外 ,你 只 能 依据 样本 的 研究 假设 的 检验 结论 来 做 
出 间接 推论 。 因 此 零 假 设 只 能 被 间接 检验 ,而 研究 假设 能 够 被 直接 检验 。 
”第 四 , 零 假 设 常用 希腊 字母 表达 ,而 研究 假设 常用 罗马 字母 表达 。 例 
如 9 年 级 学 生 的 平均 成 绩 等 于 12 年 级 学 生 的 平均 成 绩 的 零 假 设 可 以 如 下 
Жк: 


Ho: Ho =n (6.3) 
其 中 
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H, 表示 零 假 设 

ho 表示 9 年 级 学 生 总 体 的 理论 平均 值 

po 表示 12 年 级 学 生 总 体 的 理论 平均 值 

研究 假设 是 12 年 级 的 样本 的 平均 值 高 于 9 年 级 的 样本 的 平均 值 ,如 
公式 6.2 所 示 。 

最 后 ,因为 你 不 能 直接 检验 零 假 设 , 零 假设 是 暗含 的 假设 。 而 研究 假 
设 是 明确 的 , 且 便 于 表达 。 这 就 是 你 在 研究 报告 中 很 少 看 到 零 假设 而 几乎 
总 是 看 到 研究 假设 陈述 的 男 一 个 原因 。 


好 假设 的 标准 是 什么 


现在 你 知道 假设 是 学 术 猜 测 一 一 是 进一步 研究 的 起 点 。 对 所 有 的 猜 
测 来 说 ,一 开始 其 中 的 一 些 就 比 另 一 些 好 。 我 们 不 能 过 分 强调 提出 你 想 回 
答 的 问题 并 且 记 住 你 提出 的 任何 假设 都 是 对 你 要 问 的 原始 问题 的 直接 扩 
展 是 多 么 重要 。 问 题 反 映 你 个 人 的 兴趣 和 动机 ,以 及 已 完成 的 研究 。 了 解 
这 些 之 后 ,你 可 以 使 用 下 面 的 标准 来 确定 在 研究 报告 中 看 到 的 假设 或 者 自 
己 建立 的 假设 是 否 是 可 接受 的 假设 。 

我 们 使 用 一 个 研究 案例 来 说 明 这 一 点 ,这 项 研究 是 考察 为 工作 到 很 晚 
的 身 为 父母 的 员工 提供 的 放学 后 儿童 照料 对 父母 工作 适应 性 的 影响 。 下 
面 是 一 个 很 好 的 假设 : 

让 自己 的 孩子 加 入 放学 后 儿童 照料 计划 的 父母 一 年 之 内 耽误 的 
工作 日 会 减少 ,同时 依据 工作 态度 调查 的 测量 ,工作 态度 也 会 比 没有 
让 自己 的 孩子 加 入 这 个 计划 的 父母 更 积极 。 


下 面 就 是 标准 。 

首先 ,一 个 好 的 假设 一 般 是 以 陈述 句 的 形式 出 现 而 不 是 以 问题 出 现 。 
在 上 面 的 案例 中 ,没有 提出 “你 是 否认 为 父母 和 他 们 工作 的 公司 会 更 好 
…?” 这 样 的 问题 ,这 是 因为 陈述 如 果 是 明确 有 力 的 ,假设 就 更 有 效 。 

其 次 ,一 个 好 的 假设 提出 变量 间 预 期 的 关系 。 案 例 中 使 用 的 假设 清楚 
地 描述 了 放学 后 儿童 照料 父母 的 态度 和 缺勤 率 之 间 的 关系 。 这 些 变量 会 
接受 检验 来 考察 一 个 变量 (加 入 放学 后 儿童 照料 计划 ) 对 其 他 变量 (缺勤 
率 和 态度 ) 的 影响 。 

注意 到 上 面 的 标准 中 “预期 的 ”一 词 吗 ? 定义 预期 的 关系 是 为 了 避免 
像 钓 鱼 式 乱 放 枪 一 样 漫 无 目的 地 建立 一 些 无 用 的 关系 。 
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钓鱼 方法 就 是 你 把 线 扔 出 去 ,然后 抓 住 任何 咬 了 线 的 东西 。 
你 收集 尽 可 能 多 的 数据 而 不 管 研究 兴趣 是 什么 ,或 者 你 收集 的 数 
据 是 否 是 科学 调查 的 一 部 分 。 或 者 你 把 枪 装 满 子弹 ,然后 向 任何 
移动 的 东西 射击 ,你 肯定 能 射 中 什么 。 问 题 是 ,你 可 能 不 想 要 你 射 
中 的 ,更 糟糕 的 是 你 可 能 错过 你 想 要 的 ,最 坏 的 是 ( 如果 可 能 ) 你 可 
能 不 知道 你 射 中 的 是 什么 。 好 的 研究 人 员 不 仅仅 想 要 他 们 抓 到 或 
者 射 中 的 任何 东西 ,而 且 他 们 想 要 特定 的 结果 。 研 究 人 员 想 得 到 
想 要 的 数据 就 需要 开放 性 的 问题 和 明确 有 力 且 容易 理解 的 假设 。 


第 三 ,假设 反映 它们 建立 的 理论 和 文献 基础 。 就 如 在 第 1 章 看 到 的 ， 


科学 家 的 成 功 很 少 是 归结 于 他 们 自己 的 努力 工作 。 他 们 的 成 功 通常 是 由 
于 ,或 者 说 部 分 是 由 于 走 在 他 们 前 面 并 留 下 后 来 的 解释 框架 的 科学 家 。 一 
个 好 的 假设 要 反映 这 一 点 ,这 样 假设 就 和 已 存在 的 理论 和 文献 连接 在 一 
起 。 在 上 面 的 案例 中 ,我 们 假定 有 文献 表明 父母 知道 孩子 在 妥当 的 环境 中 
得 到 照料 就 会 感到 更 放心 ,然后 就 能 在 工作 中 表现 得 更 好 。 了 解 这 些 就 可 
以 假设 放学 后 照料 孩子 计划 能 提供 父母 所 寻求 的 安心 。 相 应 的 父母 就 会 
集中 精神 工作 而 不 是 不 断 地 打 电 话 确 定 他 们 的 孩子 雷 切 尔 (Rachel ) 或 者 
Hi E RE (Gregory) 是否 安 全 到 家 。 

第 四 ,假设 应 该 简短 并 切中 要 点 。 你 要 使 假设 以 陈述 句 的 形式 描述 变 
量 间 的 关系 ,并 且 尽 可 能 直接 和 明确 。 越 是 切中 要 点 ,其 他 人 (如 你 的 硕 
士 论 文 或 博士 论文 答辩 委员 会 成 员 ) 就 越 容易 阅读 你 的 研究 、 理 解 你 的 假 
设 是 什么 以 及 重要 的 变量 是 什么 。 实 际 上 , 当 人 们 阅读 并 评价 研究 (你 会 
在 后 面 的 章节 学 到 更 多 ) 时 ,他 们 中 的 大 多 数 做 的 第 一 件 事 就 是 找到 假 
设 , 从 而 就 对 研究 的 一 般 目 的 和 研究 是 如 何 进行 的 有 了 很 好 的 了 解 。 一 个 
好 的 假设 可 以 反映 这 两 个 方面 。 

第 五 ,好 的 假设 是 可 检验 的 假设 。 这 意味 着 你 可 以 实际 的 回答 假设 中 
包含 的 问题 。 你 可 以 从 上 面 的 示例 假设 中 看 到 让 孩子 加 入 放学 后 照料 计 
划 的 父母 和 没有 让 和 孩子 加 入 的 父母 之 间 的 重要 比较 。 态 度 或 缺勤 的 天 数 
是 可 测量 的 变量 。 两 者 都 是 合理 的 目标 。 态 度 可 以 通过 工作 态度 调查 来 
测量 (假定 的 题目 ,但 是 你 可 以 了 解 ) ,缺勤 (缺勤 的 天 数 ) 很 容易 被 精确 地 
记录 。 如 果 建 立 的 假设 是 “让 孩子 加 入 放学 后 照料 计划 的 父母 对 工作 的 
感觉 更 好 ”, 想 想 还 会 有 多 少 困 难 的 事 。 即 使 你 得 到 相同 的 信息 ,“ 感 觉 更 | 
好 ”这 个 模棱两可 的 词 就 会 使 得 结果 更 难 解释 。 

总 之 ,假设 应 该 

е 以 陈述 句 的 形式 表述 

e 假定 变量 间 的 关系 

e 反映 假设 建立 的 理论 和 文献 基础 

e 简短 并 切中 要 点 ,并且 
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° 可 检验 。 
如 果 假 设 满足 这 五 个 标准 ,你 可 以 了 解 这 个 假设 很 好 ,足以 继续 进行 
研究 ,来 准确 地 检验 作为 假设 来 源 的 一 般 问 题 。 
u 2 2 A АНОРА САИНОВА НАННАН 
| 小 & 
任何 科学 研究 的 中 心 要 素 是 假设 ,而 不 同 的 假设 类 型 ( 零 假设 和 研究 假设 ) 
有 助 于 形成 计划 来 回答 我 们 的 研究 所 提出 的 问题 。 零 假设 作为 研究 起 点 和 比较 
基础 的 特点 使 得 我 们 可 以 使 用 零 假 设 作为 评价 研究 假设 可 接受 的 比较 基准 。 现 
在 我 们 继续 学 习 如 何 实际 检验 零 假 设 。 


练习 时 间 

1. 去 图 书馆 查找 你 感 兴趣 的 领域 的 五 个 经 验 研 究 文章 (包含 数据 ) 。 对 于 每 
一 个 研究 , 列 出 下 面 的 内 容 : 

а. 零 假 设 是 什么 (潜在 的 还 是 明确 的 陈述 )? 

b. 研究 假设 是 什么 (潜在 的 还 是 明确 的 陈述 )? 

с. 在 你 感 兴 趣 的 领域 ,建立 一 个 零 假设 和 一 个 研究 假设 。 

d. 那些 没有 明确 的 或 潜在 的 假设 的 文章 又 怎样 呢 ? 确认 这 些 文章 ,并 看 看 
你 是 否 可 以 建立 一 个 研究 假设 。 

2. 依据 下 面 的 研究 问题 ,建立 一 个 零 假设 ,一 个 有 方向 研究 建设 ,一 个 无 方 
向 研究 假设 。 

a. 注意 力 对 教室 里 不 专心 听课 行为 的 影响 如 何 ? 

b. 婚姻 的 质量 和 夫妇 双方 与 他 们 兄弟 姐妹 间 关 系 好 坏 之 间 的 关系 如 何 ? 

c. 治疗 厌食 症 的 最 好 方式 是 什么 ? 

3. 回 到 问题 1 中 找到 的 5 个 假设 ,并 用 本 章 最 后 部 分 讨论 的 5 个 标准 进行 评 
价 。 


练习 参考 答案 

问题 1 和 问题 3 会 因为 你 的 兴趣 而 不 同 。 因 此 ,虽然 没有 正确 的 答案 ,但 是 

不 同 的 假设 很 多 。 
2а. 零 假设 :依据 注意 时 间 观 察 量 表 的 测量 ,注意 时 间 短 的 学 生 和 注意 时 间 

长 的 学 生 不 专心 听课 行为 的 频率 相同 。 

有 方向 研究 假设 :依据 注意 时 间 观 察 量 表 的 测量 ,注意 时 间 短 的 学 生 比 注意 
时 间 长 的 学 生 不 专心 听课 行为 的 频率 要 高 。 

无 方向 假设 :依据 注意 时 间 观 察 量 表 的 测量 ,注意 时 间 短 的 学 生 不 专心 听课 
行为 的 频率 不 同 于 注意 时 间 长 的 学 生 。 
2b. 零 假 设 :婚姻 质量 和 夫妇 双方 与 他 们 兄弟 姐妹 关系 的 好 坏 之 间 没 有 
关系 。 

有 方向 研究 假设 :婚姻 质量 和 夫妇 双方 与 他 们 兄弟 姐妹 关系 的 好 坏 之 间 有 


б БЖБ МЕНІН 83 


正 向 关系 。 

无 方向 假设 :婚姻 质量 和 夫妇 双方 与 他 们 兄弟 姐妹 关系 的 好 坏 有 关 。 

2с. 零 假设 :结合 传统 心理 治疗 的 药物 治疗 和 单独 的 传统 心理 治疗 对 治疗 厌 
食 症 有 相同 的 效果 。 

有 方向 研究 假设 :结合 传统 心理 治疗 的 药物 治疗 比 单独 的 传统 心理 治疗 对 
治疗 厌食 症 更 有 效 。 

无 方向 假设 :结合 传统 心理 治疗 的 药物 治疗 和 单独 的 传统 心理 治疗 对 治疗 
厌食 症 具 有 不 同 的 效果 。 


你 的 曲线 是 正 态 的 吗 
一 概率 和 概率 的 重要 性 





本 章 你 会 学 到 什么 


e 为 什么 理解 概率 是 理解 统计 学 的 基础 
。 什么 是 正 态 曲线 或 钟 型 曲线 ,其 特点 是 什么 
o 如 何 计 算 和 解释 z 值 


为 什么 学 习 概 率 


现在 你 认为 这 是 统计 学 课程 了 吧 ! 好 吧 , 就 如 你 在 这 一 章 将 学 到 的 ， 
学 习 概率 是 理解 正 态 曲线 (接着 会 有 更 多 讨论 ) 的 基础 ,也 是 理解 推论 统 
计 的 基础 。 

为 什么 ? 首先 , 正 态 曲线 给 我 们 提供 了 理解 任何 可 能 结果 (如 一 次 考 
试 中 得 到 某 个 具体 分 数 的 几率 ,或 者 投掷 硬币 时 得 到 正面 的 几率 ) 的 概率 
的 基础 。 

其 次 ,概率 研究 是 决定 我 们 在 陈述 特定 的 发 现 或 结果 是 “ 真 "时 所 具 
有 的 可 信和 度 的 基础 。 或 者 更 好 的 说 法 是 , 某 个 结果 (如 平均 成 绩 ) 没有 出 
现 是 由 于 偶然 因素 。 例 如 ,我 们 比较 A 群体 (每 星期 参加 3 小 时 的 额外 游 
泳 训练 ) 和 B 群体 (每 星期 都 没有 额外 训练 )。 我 们 发 现 A 群体 的 适度 性 
测验 和 В 群体 不 同 。 但 是 我 们 可 以 说 这 个 差异 是 由 于 额外 训练 引起 ,或 
者 是 其 他 因素 引起 的 吗 ? 概率 研究 提供 的 工具 允许 我 们 确定 差异 是 由 于 
练习 或 其 他 因素 引起 的 准确 的 可 能 性 数值 。 

上 一 章 我 们 花费 在 假设 上 的 所 有 时 间 都 是 值得 的 。 一 旦 把 对 零 假 设 
和 研究 假设 的 理解 和 概率 基础 的 想法 结合 在 一 起 ,我 们 就 可 以 讨论 特定 结 
R 由 研究 假设 建立 ) 出 现 的 可 能 性 。 


正 态 曲线 (或 钟 型 曲线 ) 


什么 是 正 态 曲线 ? 正 态 曲线 (normal curve ,叫做 钟 型 曲线 ,或 钟 形 曲 
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线 ) 就 是 具备 三 个 特征 的 数据 分 布 的 形象 表示 。 图 7.1 表明 了 这 三 个 
特征 。 


рс; ШЕ 


渐 近 的 线 尾 


> 


中 位 数 
众 数 


图 7.1 正 态 曲线 或 钟 形 曲 线 


正 态 曲 线 表示 均值 .中 位 数 和 众 数 相 等 的 数值 分 布 。 你 可 能 还 记得 第 
4 章 的 内 容 , 也 就 是 如 果 中 位 数 和 均值 不 同 ,那么 数据 分 布 就 向 某 个 方向 
倾斜 。 正 态 曲 线 没 有 偏 度 。 正 态 曲 线 有 一 个 很 好 的 波峰 (只 有 一 个 ) ,而 
且 波 峰 正 好 处 于 中 间 。 

其 次 , 正 态 曲线 以 均值 为 中 心 完 全 对 称 。 如 果 沿 着 中 心 线 将 曲线 对 
折 ,两 边 会 完全 重重 。 两 边 是 相等 的 。 曲 线 的 一 半 是 另 一 半 的 镜像 。 

最 后 (准备 好 学 习 新 的 内 容 ) , 正 态 曲线 的 双 尾 是 渐 近 的 (asymptot- 
ic ) 一 个 很 陌生 的 词 。 这 个 词 的 含义 是 曲线 的 双 尾 越 来 越 逼 近 横 轴 ， 
但 是 永远 不 会 与 横 轴 相交 。 

正 态 曲线 的 钟 型 形状 给 这 个 曲线 另外 一 个 名 称 ,也 就 是 钟 型 曲线 。 





即使 作者 对 渐 近 性 有 很 好 的 了 解 ,他 也 想 知道 正 态 曲 线 的 尾 
ү 线 如 何 逼 近 横 轴 或 x 轴 却 永 不 相交 。 试 着 做 下 面 的 实验 。 放 置 两 
BN 支 相距 一 英寸 的 铅笔 ,然后 移 进 一 半 ,他 们 就 相距 1⁄2 英寸 ,再 移 

| б 近 1/4 英寸 ,再 移 近 1/8 英寸 。 这 两 支 铅笔 会 持续 的 接近 ,对 吧 ? 

但 是 不 会 (永远 不 会 ) 相 交 。 正 态 曲线 的 尾 线 同 样 如 此 。 尾 线 缓慢 
地 接近 曲线 “ 栖 居 ”其 上 的 数 轴 , 但 是 永远 不 会 真正 相交 。 

这 一 点 为 什么 很 重要 ? 在 本 章 后 面 的 部 分 你 将 会 了 解 , 尾 线 
从 不 相交 的 事实 意味 着 可 能 得 到 的 极 值 (在 曲线 的 左 侧 或 右 侧 ) 存 
在 无 限 小 的 可 能 性 。 如 果 尾 线 和 数 轴 相 交 , 就 得 不 到 原本 可 能 存 
在 的 极 值 了 。 | 


嘿 , 这 不 是 正太 曲线 
我 们 希望 你 接 下 来 的 问题 是 ,“ 但 是 有 许多 数据 集 的 分 布 不 是 正 态 的 
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或 不 是 钟 型 的 ,对 吧 ?” 是 的 。 但 当 我 们 处 理 大 样本 数据 集 (超过 30 个 数 
据 ) ,并 且 重 复 地 从 总 体 中 抽取 样本 时 ,曲线 的 数值 就 接近 正 态 曲线 的 形 
状 。 这 很 重要 ,因为 我 们 讨论 的 通过 样本 推论 总 体 时 所 做 的 大 多 数 工 作 都 
是 基于 这 样 的 假设 一 一 总 体 中 抽取 的 样本 是 正 态 分 布 的 。 

而 且 事 实 是 大 体 上 许多 事物 的 分 布 特征 就 是 我 们 所 说 的 正 态 分 布 。 
也 就 是 说 大 多 事件 或 发 生 次 数 正好 在 数据 分 布 的 中 间 ,而 两 端 却 较 少 ,就 
如 在 图 7.2 中 所 看 到 ,图 7.2 表示 一 般 总 体 中 IQ 和 身高 的 分 布 。 


多 数 人 


人 数 


少数 人 
IIE E G рд 


ie е aaa. 2: 
图 7.2 数值 如 何 分 布 


例如 ,一 个 群体 中 聪明 人 很 少 ,处 在 群体 底 端的 智力 或 认 知 能 力 很 低 
的 人 也 很 少 。 大 多 数 人 正好 处 在 曲线 的 中 间 ,而 我 们 移 到 曲线 的 尾 线 时 人 
数 减 少 。 高 个 的 人 相当 的 少 , 矮 个 的 人 也 相当 的 少 , 而 大 多 数 人 处 在 中 间 。 
在 这 两 个 案例 中 ,智力 和 身高 的 分 布 接近 正 态 分 布 。 

相应 的 , 正 态 曲线 中 极 值 范围 内 发 生 的 每 一 个 事件 具有 很 小 的 发 生 概 
率 。 我 们 可 以 很 确信 地 说 任何 人 (我 们 还 不 知道 他 们 的 身高 ) 个 子 很 高 的 
几率 不 是 很 大 。 但 是 我 们 知道 任何 人 处 于 平均 身高 的 几率 或 者 正好 处 于 
中 间 范 围 的 几率 很 高 。 那 些 发 生 在 正 态 曲线 中 间 的 事件 的 概率 高 于 极 值 
范围 内 发 生 的 事件 的 概率 。 


更 正 态 的 曲线 101 


你 已 经 知道 有 三 个 主要 的 特征 使 得 曲线 成 为 正 态 曲线 ,或 者 看 起 来 更 
像 钟 型 ,但 是 正 态 曲线 不 仅仅 是 这 三 个 特点 。 认 真 地 看 图 7.3 中 的 曲线 。 
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原始 数值 一 一 70 о 9% 10 по 10 130 


(均值 ) 
标准 差 ----3 -2 -1 0 3 


73 分 成 多 个 部 分 的 正 态 曲线 


这 里 展示 的 分 布 的 均值 是 100 ,标准 差 是 10。 我 们 已 经 在 * 轴 上 增加 
了 表示 数据 分 布 中 偏离 于 均值 的 以 标准 差 表 示 的 距离 。 你 可 以 看 到 x 轴 
(表示 分 布 中 的 数值 ) 的 刻度 是 以 10( 也 就 是 分 布 的 标准 差 ) 为 间隔 从 70 


增加 到 130 ,10 是 一 个 标准 差 的 值 。 我 们 编制 了 这 些 数字 (100 和 10) ,所 ` 


以 不 要 去 猜测 我 们 如 何 得 到 这 些 数字 。 

如 此 ,短暂 的 回顾 告诉 我 们 分 布 的 均值 是 100 ,标准 差 是 10。 曲 线 内 
的 每 条 垂直 线 将 曲线 分 成 一 个 部 分 ,每 个 部 分 由 特定 的 值 限 定 。 例 如 均值 
100 右 端 的 第 一 部 分 由 数值 100 和 110 限定 ,这 表示 偏离 均值 (均值 是 
100 ) 一 个 标准 差 。 

而 且 在 每 一 个 原始 数值 (70 ,80 ,90 ,100 ,110 ,120 ,130) 下 端 ,你 会 发 现 
相应 的 标准 差 ( -3, -2, -1,0,1,2,3)。 就 如 你 已 经 指出 的 ,我 们 的 案例 
中 每 一 个 标准 差 是 10。 因 此 偏离 均值 (均值 是 100) 一 个 标准 差 就 是 均值 
加 10 或 者 是 110。 不 是 很 难 , 对 吧 ? 

如 果 我 们 深入 进行 讨论 ,你 就 能 够 看 到 均值 为 100 ,标准 差 为 10 的 正 
态 分 布 表示 的 数值 范围 是 70 到 130( 包 括 -3 到 3 个 标准 差 )。 

有 关 正 态 分 布 .均值 和 标准 差 的 一 个 重要 事实 始终 是 正确 的 :对 任何 
数值 分 布 来 说 (不 论 均值 和 标准 差 的 具体 数值 ) ,如 果 数 值 是 正 态 分 布 的 ， 
几乎 100% 的 数值 处 于 均值 的 -3 到 3 个 标准 差 范 围 内 。 这 非常 重要 , 因 
为 这 个 事实 适合 所 有 的 正 态 分 布 。 因 为 这 个 规则 的 确 很 实用 (再 说 一 次 ， 
不 论 均值 和 标准 差 的 具体 数值 ) ,所 以 数据 分 布 之 间 可 以 相互 比较 。 接 下 
来 我 们 还 会 讨论 。 | 

接着 上 面 的 内 容 , 我 们 再 进一步 深入 讨论 。 如 果 数 值 分 布 是 正 态 的 ， 
我 们 也 可 以 说 一 定 百分比 的 数值 会 落 在 x 轴 的 不 同 数据 点 之 间 ( 例 如 均值 
和 一 个 标准 差 之 间 )。 实 际 上 数值 分 布 中 大 约 34% (实际 上 是 34. 13% ) 
的 数值 落 在 了 均值 (在 这 个 案例 中 是 100 一 一 计算 出 来 了 吗 ?) 和 均值 以 上 
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1 个 标准 差 (就 是 110) 的 范围 内 。 你 可 以 将 这 个 事实 存 人 银行 ”, 因 为 这 


是 永远 正确 的 。 


想 了 解 更 多 吗 ? 认真 地 看 图 7.4。 你 可 以 看 到 特征 明显 的 同样 的 正 
态 曲线 (均值 等 于 100 ,标准 差 等 于 10) 一 一 以 及 均值 和 标准 差 限 定 范围 内 
我 们 预期 出 现 的 数值 的 百分比 。 


-- 13% 
80 90 100 10 120 130 


-13% 


原始 数值 一 一 70 
标准 差 ----3 


-2 -1 0 1 


2 3 


7.4 正 态 曲线 下 数据 值 的 分 布 


下 面 是 我 们 可 以 得 出 的 结论 。 
两 者 间 的 距离 包括 的 数据 值 
均值 和 1 个 标准 差 曲线 覆盖 34. 13% 的 数据 值 


1 个 标准 差 和 2 个 标准 差 
2 个 标准 差 和 3 个 标准 差 
3 个 标准 差 及 以 上 


曲线 覆盖 13.59% 的 数据 值 
曲线 覆盖 2. 15% 的 数据 值 
曲线 覆盖 0. 13% 的 数据 值 


包括 的 数值 范围 (如 果 均 值 


=100 ,标准 差 =10) 
100—110 
110—120 
120—130 


130 以 上 


如 果 你 将 正 态 曲线 每 一 半 的 百 分 值 加 起 来 , 猜 猜 你 会 得 到 什么 ?很 
对 ,是 50% 。 为 什么 ? 正 态 曲 线 之 下 ,均值 和 均值 右 侧 所 有 数值 的 距离 范 
围 内 包括 了 50% 的 数值 。 

因为 曲线 是 中 心 线 对 称 的 (每 一 半 是 另 一半 的 镜像 ) ,两 个 部 分 加 起 
来 表示 100% 的 数值 。 虽 然 不 是 火箭 科学 ,但 是 指出 这 一 点 很 重要 。 

现在 我 们 将 这 个 逻辑 应 用 到 均值 100 左 侧 的 数值 。 


两 者 间 的 距离 


均值 和 1 个 标准 差 

-1 个 标准 差 和 -2 个 标准 差 
-2 个 标准 差 和 -3 个 标准 差 
-3 个 标准 差 及 以 下 


包括 的 数据 值 


曲线 覆盖 34. 13% 的 数据 值 
曲线 覆盖 13.59% 的 数据 值 
曲线 覆盖 2. 15% 的 数据 值 
曲线 覆盖 0.13% 的 数据 值 


包括 的 数值 范围 ( 如果 均 
值 =100 ,标准 差 =10) 
90 一 100 
80 一 90 
70 一 80 
70 以 下 
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现在 要 记 住 的 是 我 们 使 用 的 均值 100 和 标准 差 10 仅仅 是 特定 案例 的 
样本 统计 值 。 很 明显 ,不 是 所 有 的 分 布 都 是 均值 为 100 \ 标 准 差 为 10。 

所 有 的 这 些 都 有 规律 ,特别 是 你 会 发 现 34. 14% ,13.59% 等 数值 独立 
于 实际 的 均值 和 标准 差 。 粗 略 地 说 这 个 数字 是 34% ,这 是 因为 曲线 的 形 
状 而 不 是 因为 具体 的 均值 和 标准 差 。 实 际 上 ,如 果 你 在 一 个 硬 纸板 上 绘制 
正 态 曲 线 ,接着 将 均值 和 一 个 标准 差 范 围 内 的 区 域 切 下 来 ,然后 称 出 重量 ， 

， 重 量 恰好 是 从 中 切除 曲线 的 整个 硬 纸板 的 34. 13% 。( 试 一 次 ,这 是 

真 的 。) 

在 我 们 的 案例 中 ,这 意味 着 (粗略 地 说 )68%( 双 倍 的 34.13% ) 的 数值 
落 在 原始 数据 90 到 110 之 间 。 那 么 其 他 32% 呢 ? 这 个 问题 很 好 。 一 半 
(16% ,或 者 13.59% +2.15% +0.13% ) 落 在 均值 的 一 个 标准 差 以 上 ( 均 
值 右 侧 ) , 另 一 半 落 在 均值 的 一 个 标准 差 以 下 (均值 左 侧 ) 。 而 且 因为 曲线 
的 斜率 ,所 以 数值 越 偏离 均值 ,曲线 覆盖 的 区 域 的 范围 就 越 小 ,那么 一 个 数 
值 落 在 数据 分 布 极 值 范围 内 的 可 能 性 要 小 于 落 在 中 间 的 可 能 性 ,这 一 点 不 
惊奇 。 这 也 是 为 什么 曲线 在 中 间 有 波峰 而 没有 任何 方向 的 偏 度 。 


我 们 最 中 意 的 标准 值 :z {Н 


你 已 经 多 次 看 到 数据 分 布 在 集中 趋势 和 变异 性 方面 如 何 的 不 同 。 

在 一 般 的 研究 实践 中 ,我 们 会 发 现 所 处 理 的 分 布 相当 不 同 , 但 是 我 们 
需要 对 它们 进行 相互 比较 。 而 进行 这 样 的 比较 我 们 需要 一 定 的 标准 。 

这 就 是 标准 值 (standard scores) 。 这 些 值 以 标准 差 为 单位 进行 了 标准 
化 所 以 是 可 比较 的 。 例 如 ,均值 为 50 ,标准 差 为 10 的 分 布 的 标准 值 与 均 
值 为 100 ,标准 差 为 5 的 分 布 的 标准 值 都 是 1; 他 们 都 表示 一 个 标准 值 , 并 
且 与 各 自 均值 的 距离 也 相同 。 我 们 也 可 以 使 用 正 态 曲 线 的 知识 ,并 确定 偏 
离 均值 一 个 标准 差 的 数值 出 现 的 概率 。 我 们 在 后 面 会 继续 。 

虽然 还 有 其 他 类 型 的 标准 值 , 但 是 学 习 统 计 学 过 程 中 最 常 看 到 的 是 z 
值 (z score) o z 值 就 是 原始 数据 与 数据 分 布 均值 的 差 除 以 标准 差 所 得 的 结 
果 ( 见 公式 7.1)。 


z = (7,1) 


其 中 

z 是 z 值 

和 是 具体 的 数值 

X 是 数据 分 布 的 均值 

s 是 数据 分 布 的 标准 差 

例如 ,应 用 公式 7.1 你 可 以 看 到 如 何 计算 均值 是 100 原始 数值 是 110 
标准 差 是 10 的 z 值 。 


о 42%9% ар 


z = 110-100 = +1.0 (7,2) 


- 





下 面 是 均值 为 12 ,标准 差 为 2, 样本 规模 为 10 的 原始 数值 和 相应 的 = 
值 。 均 值 以 上 的 原始 数值 对 应 的 z 值 是 正 数 , 反 之 ,均值 以 下 的 原始 数值 
对 应 的 z 值 是 负数 。 例 如 ,原始 数值 15 对 应 的 z 值 是 +1.5, 原 始 数值 8 对 
应 的 z 值 是 -2。 当 然 与 均值 相等 的 原始 数值 12( 或 均值 ) 的 z 值 是 0, 因 
为 原始 数值 与 均值 的 距离 为 0。 


Х Х-Х z 值 


12 0 0 
15 3 1:5 
11 -1 -0.5 
13 1 0.5 
8 -4 -2 
14 2 1 
12 0 0 
13 1 0.5 
12 0 0 
10 -2 -1 


依据 对 以 上 数值 的 观察 进行 简要 的 总 结 。 

首先 ,均值 以 下 的 数值 (如 8 和 10) 对 应 的 z 值 是 负数 ,而 均值 以 上 的 
数值 (如 13 和 14) 对 应 的 z 值 是 正 数 。 

其 次 , 正 的 z 值 一 般 落 在 均值 的 右 侧 , 也 就 是 数据 分 布 的 上 半 部 分 。 
负 的 z 值 通常 落 在 均值 的 左 侧 ,也 就 是 数据 分 布 的 下 半 部 分 。 

第 三 ,我 们 讨论 落 在 均值 一 个 标准 差 以 上 的 一 个 数值 时 ,也 就 是 说 这 
个 数值 是 在 均值 的 一 个 标准 值 之 上 。 就 我 们 的 目的 来 说 ,比较 数据 分 布 的 
数值 时 使 用 标准 差 和 z 值 是 相当 的 。 换 句 话说 ,z 值 就 是 偏离 均值 的 标准 
差 的 个 数 。 

最 后 也 是 最 重要 的 一 点 ,不 同 分 布 的 z 值 具有 可 比 性 。 我 们 应 用 下 面 
的 数据 表 说 明 这 一 点 ,这 个 数据 表 和 上 一 个 类 似 。 我 们 从 100 个 数值 中 选 
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T 10 个 样本 数值 ,样本 分 布 的 均值 是 59 ,标准 差 是 14.5. 


原始 数值 x. Y z 值 
67 8 0.55 
54 -5 -0.34 
65 6 0.41 
33 -26 -1.79 
56 -3 -0.21 
76 17 1.17 
65 6 0.41 
33 - 26 -1.79 
48 -11 -0.76 
76 17 ТТ! 





在 之 前 看 到 的 均值 是 12 标准 差 是 2 的 数据 分 布 中 ,原始 数值 12. 8 对 
应 的 Z 值 是 +0.4, 也 就 是 说 原始 数据 12.8 距离 均值 0.4 个 标准 差 。 在 均 
值 是 59 标准 差 是 14.5 的 第 二 个 数据 分 布 中 ,原始 数值 64.8 对 应 的 2Z 值 
也 是 +0.4。 这 是 奇迹 吗 ? 不 ,这 只 是 一 个 很 好 的 想法 。 

原始 数值 12.8 和 64.8 相对 来 说 与 均值 的 距离 相等 。 如 果 这 些 原 始 
数值 用 标准 值 表 示 ,就 可 以 直接 使 用 各 自分 布 中 的 相对 位 置 来 直接 进行 相 
互 比较 。 


z 值 表示 什么 


你 已 经 了 解 特 定 的 z 值 表示 一 个 原始 数值 ,也 表示 数据 分 布 在 x 轴 上 
的 特定 位 置 。 而 且 z 值 越 大 (例如 -2 或 +2.6) ,距离 均值 越 远 。 
因为 你 已 经 知道 落 在 x 轴 的 特定 两 点 之 间 的 面积 的 百分比 ,例如 均值 
和 +1 个 标准 差 之 间 的 面积 是 34% , + 1 个 标准 差 和 + 2 个 标准 差 之 间 的 
面积 是 14% ,我 们 也 可 以 得 出 如 下 正确 的 结论 : 
° 84% 的 数值 落 在 值 为 +1 的 z 值 之 下 (50% 落 在 均值 之 下 ,34% 落 
在 均值 和 值 为 +1 的 z 值 之 间 )。 
%16% 的 数值 落 在 值 为 +1 的 z 值 之 上 (曲线 下 的 全 部 面积 是 100% , 
84% 的 数值 落 在 值 为 +1 的 z 值 之 下 ) 
想 一 下 上 面 的 两 个 结论 。 我 们 所 要 表达 的 是 ,如 果 数 据 分 布 是 正 态 分 
布 ,曲线 的 不 同 面积 可 以 用 标准 差 或 者 z 值 的 不 同 数值 来 表示 。 
当然 要 明白 这 些 面积 或 比例 也 可 以 很 容易 地 被 看 作 是 表示 特定 数值 
出 现 的 概率 。 例 如 ,这 里 有 一 个 问题 : 
在 均值 为 100 标准 差 为 10 的 数据 分 布 中 ,110 或 110 以 上 的 数值 出 现 
的 概率 是 多 少 ? 
答案 是 16% ,或 者 说 100 次 中 会 出 现 16 次 。 我 们 如 何 得 到 答案 ? 
首先 我 们 计算 对 应 的 z 值 ,也 就 是 +1[(110 - 100)Z10] 。 接 着 ,依据 
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我 们 已 了 解 的 知识 ( 见 表 7.4) ,我 们 知道 z 值 为 1 表示 x 轴 上 的 一 个 特定 
位 置 ,数据 分 布 中 84% 的 数值 落 在 这 个 位 置 之 下 ,这 个 位 置 之 上 是 16% 的 
数值 或 概率 是 . 16 。 因 为 我 们 已 经 知道 均值 和 均值 之 上 或 之 下 1,2 和 3 个 
标准 差 之 间 的 面积 ,我 们 可 以 很 容易 地 得 出 任何 z 值 对 应 的 数值 出 现 的 
概率 。 

但 是 我 们 介绍 的 方法 对 于 z 值 是 1,2 和 3 很 合适 。 但 是 如 果 z 值 不 是 
像 2 一 样 的 整数 ,而 是 像 1.23, - 2.01 一 样 的 非 整 数 ,该 如 何 确定 呢 ? 我 
们 需要 找到 更 简洁 的 方法 。 

我 们 怎么 办 呢 ? 很 简单 ,就 是 学 会 微 积分 并 将 微 积 分 应 用 到 正 态 曲线 
来 计算 x 轴 上 每 一 个 可 能 的 值 对 应 的 曲线 面积 ,或 者 我 们 更 喜欢 使 用 附录 
B( 正 态 分 布 表 ) 的 Bl 表 。 表 中 列 出 了 不 同 2 值 对 应 的 曲线 之 下 的 所 有 面 
积 数 值 ,当然 不 包括 极 值 。 这 个 表 有 两 列 。 第 一 列 是 z 值 ,就 是 已 经 计算 
的 z 值 。 第 二 列 是 均值 和 z 值 之 间 的 面积 ,就 是 这 两 点 之 间 曲 线 所 覆盖 的 
面积 。 

例如 ,如 果 我 们 想 知道 均值 和 值 为 +1 的 z 值 之 间 的 面积 ,在 z 值 列 找 
到 数值 1. 00 ,接着 在 对 应 的 第 二 列 找到 均值 和 z 值 1.00 之 同 的 面积 数值 
34.13。 你 以 前 看 到 过 这 样 的 表 吗 ? 

为 什么 在 表 中 没有 正 号 或 负 号 ,如 — 1. 00 呢 ? 因 为 曲线 是 对 称 的 ,z 
值 是 正 是 负 对 数值 没有 影响 。 均 值 和 1 个 标准 差 之 间 的 面积 在 任何 方向 


上 都 是 34. 13% 。 


接着 往 下 。 对 于 特定 的 z 值 如 1.38 来 说 ,你 想 知道 与 z 值 对 应 的 概 
率 。 如 果 你 想 知道 均值 和 z 值 1.38 之 间 的 面积 百分比 ,你 可 以 在 ВІ 表 中 
找到 对 应 z 值 1.38 的 面积 是 41. 62 ,这 表明 数据 分 布 中 41% 以 上 的 数据 落 
在 z 值 0 和 1.38 之 间 , 而 92% (50% +41.62% ) 的 数据 落 在 z 值 1.38( 包 
括 1.38) 之 下 。 现 在 你 肯定 已 经 注意 到 最 后 的 案例 中 根本 没有 提 到 原始 
数值 。 一 旦 你 会 用 这 个 表 ,就 不 再 需要 原始 数值 。 

但 是 我 们 是 否 始 终 只 对 均值 和 一 些 z 值 之 间 的 面积 感 兴趣 ? 要 不 要 
关注 两 个 z 值 之 间 的 面积 呢 ? 例如 ,我 们 有 兴趣 知道 的 是 z 值 1.5 和 z 值 
2.5 之 间 的 面积 ,或 者 说 数值 落 在 这 两 个 z 值 之 间 的 概率 是 多 少 ? 我 们 如 
何 使 用 这 个 表 计 算 这 些 结果 ? 这 很 容易 。 只 要 找到 每 一 个 z 值 对 应 的 面 
积 , 然 后 用 一 个 减 去 男 一 个 。 通 常 绘 制 如 图 7.5 所 示 的 图 有 助 于 我 们 
理解 。 

例如 ,我 们 想 找 到 均值 为 100 ,标准 差 为 10 的 数据 分 布 中 原始 数值 
110 和 125 之 间 的 面积 。 我 们 可 以 采用 如 下 的 步骤 。 





1 一 计算 原始 数值 110 对 应 的 z 值 ,也 就 是 (110 -100)/10, 即 +1。 

2 一 计算 原始 数值 125 对 应 的 z (Н, 也 就 是 (125 - 100)/10, 
Вр -2.5, 

3 一 使 用 附录 B 的 Bl 表 , 找 到 均值 和 z 值 +1l 之 间 的 面积 ,是 
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34.13% 。 

4 一 使 用 附录 B 的 ВІ 表 , 找 到 均值 和 z 值 +2.5 之 间 的 面积 ， 
是 49.38% 。 

5 一 因为 你 想 知道 两 个 z 值 之 间 的 距离 ,用 较 大 的 数 减 去 较 小 的 数 ， 
也 就 是 49. 38% – 34. 13% ,结果 是 15.25% 。 图 7.5 中 包含 很 
多 信息 。 





34.13% 


Z fË 





图 7.5 绘图 说 明 不 同 z 值 之 间 面 积 的 差异 


因此 我 们 十 分 确信 ,特定 数值 出 现 的 概率 可 以 通过 确定 这 个 数值 相对 


其 他 数值 落 在 数据 分 布 的 某 个 区 域 来 进行 很 好 的 理解 。 在 这 个 案例 中 , 数 
值 出 现在 z 值 +1 和 z 值 +2.5 之 间 的 概率 大 约 是 15% 。 

这 儿 还 有 另 一 个 例子 。 在 均值 100 ,标准 差 10 的 数据 集中 ,原始 数值 
117 对 应 的 z 值 是 1.70。 这 个 z 值 对 应 的 曲线 覆盖 面积 是 95. 54% (50% 
+45.54% ) ,意味 着 数值 出 现在 z 值 1.70 之 下 的 概率 是 95. 54% * ,或 者 
说 100 个 中 有 95.5 个 ,或 者 是 .955。 


:ф 


关于 标准 值 的 两 个 方面 。 首 先 ,虽然 我 们 关注 的 重点 是 z 值 ， 
但 还 有 其 他 类 型 的 标准 值 。 例 如 ,7 值 是 另 一 种 类 型 的 标准 值 , 通 
过 z 值 乘 以 10 加 50 来 计算 。 这 个 标准 值 的 优点 是 很 少 出 现 负 值 。 
和 z 值 一 样 ,T 值 也 可 以 比较 不 同 数据 分 布 的 数值 。 

其 次 ,标准 值 和 标准 差 完 全 不 同 。 标 准 值 来 自 预 先 确 定 均 值 
和 标准 差 的 数据 分 布 。 考 试 成 绩 如 SATs 和 СКЕ» (研究生 入 学 考 
试 ) 的 标准 值 的 使 用 可 以 很 容易 地 比较 均值 和 标准 差 相同 的 数据 
分 布 的 数值 。 


* 原 书 为 z> 值 0 和 1.70 之 间 。 译 者 注 
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AZADE 名 上 统计 学 


z 值 真 正 表 示 什 么 


统计 游戏 的 另 一 个 作用 是 能 够 估计 某 个 结果 的 概率 。 如 果 我 们 掌握 
了 前 面 的 内 容 并 且 能 够 在 本 章 学 习 中 再 往 前 走 一 步 , 就 能 确定 某 些 特定 事 
件 发 生 的 概率 。 接 下 来 我 们 使 用 一 些 标准 来 判断 我 们 考虑 的 事件 的 发 生 
是 高 于 还 是 低 于 我 们 预期 的 随机 概率 水 平 。 研 究 假设 提出 了 预期 事件 发 
生 的 命题 ,我 们 使 用 统计 工具 来 估计 事件 发 生 的 概率 。 

这 是 统计 学 是 什么 的 “20 秒 版 本 ” ,但 是 包含 了 很 多 内 容 。 现 在 我 们 
回顾 这 一 段 所 有 的 内 容 , 并 通过 案例 来 理解 。 

比如 说 你 的 老 朋 友 ,值得 信赖 的 卢 给 了 你 一 枚 硬币 ,并 让 你 决定 硬币 
是 否 是 “ 真 的 "一 一 也 就 是 你 抛 十 次 硬币 ,可 以 得 到 5 次 正面 5 次 反面 。 因 
为 每 抛掷 一 次 出 现 正面 或 反面 的 概率 是 .5 ,所 以 我 们 预期 出 现 5 次 正面 和 
5 次 反面 。 在 10 次 独立 的 抛 硬币 实验 中 (也 就 是 一 次 抛掷 不 会 影响 下 一 
次 ) ,我 们 应 该 得 到 5 次 正面 ,等 等 。 现 在 的 问题 是 出 现 多 少 次 正面 会 确认 
这 枚 硬币 是 伪造 的 或 者 非法 的 ? 

现在 说 说 我 们 用 以 判断 适当 性 的 标准 ,也 就 是 如 果 抛 掷 10 次 硬币 我 
们 得 到 正面 (或 者 反面 ) 的 次 数 少 于 5% 次, 我们 就 能 说 硬币 是 伪造 的 , 那 
就 应 该 叫 警察 来 抓 卢 了 (或 者 他 已 经 在 假释 中 了 )。5% 就 是 统计 学 家 们 
使 用 的 标准 。 如 果 事 件 (正面 出 现 的 次 数 、 一 次 考试 的 成 绩 或 者 两 个 数据 
组 平均 值 的 差异 ) 发 生 的 概率 是 极 值 ( 我 们 所 说 的 极 值 定义 为 出 现 次 数 小 
于 5% ) ,那么 就 是 不 可 能 出 现 的 结果 ,在 这 个 案例 中 就 是 不 正当 的 结果 。 

这 是 10 次 随机 抛掷 硬币 实验 中 预期 出 现 的 正面 次 数 的 分 布 。 所 有 可 
能 的 结果 组 合 是 2 或 1 024 种 ,例如 9 次 正面 1 次 反面 ,7 次 正面 3 次 反 
面 ,10 次 正面 0 次 反面 ,等 等 。 而 10 次 抛掷 实验 中 得 到 6 次 正面 的 概率 大 
ZJ JE: 21% 。 


正面 次 数 概率 


0.00 
0.01 
0.04 
0. 12 
0.21 
0.25 
0.21 
0. 12 
0. 04 
0.01 
0.00 


© со м) с Q + ом» о 


-一 
© 


以 上 是 任何 特定 结果 出 现 的 可 能 性 ,如 10 次 投掷 中 出 现 6 次 正面 的 
可 能 性 大 约 是 . 21 ,或 21% 。 现 在 是 做 出 决定 的 时 间 。 也 就 是 10 次 抛掷 
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中 你 得 到 多 少 次 正面 就 可 以 断定 硬币 损坏 了 \ 不 均匀 аф НО. 

与 优秀 的 统计 学 家 一 样 ,我 们 定义 的 标准 也 是 5% ,之 前 我 们 也 是 这 
样 定 义 。 如 果 观 察 到 的 结果 (我 们 投掷 硬币 的 结果 ) 的 概率 小 于 5% ,我 们 
可 以 断定 这 是 不 可 能 的 ,除非 有 非 概 率 事件 出 现 一 一 我 们 的 结论 就 是 “ 非 
概率 事件 ”是 伪造 的 硬币 。 

看 看 上 面 的 数据 表 ,你 就 会 发 现 8、9 或 10 次 正面 出 现 的 结果 都 小 于 
5% 。 因 此 ,如 果 10 次 硬币 投掷 的 结果 是 8、9 或 10 次 正面 ,结论 就 是 这 枚 
硬币 不 是 真 的 。( 当然 正面 出 现 0、1 或 2 次 也 能 得 出 相同 的 结论 ,这 是 对 
的 。 硬 币 另 一 面 的 出 现 情 形 也 如 此 。) 

相同 的 逻辑 也 适用 于 在 之 前 关于 z 值 的 讨论 。 我 们 预期 z 值 多 大 就 
可 以 断定 一 个 结果 的 出 现 不 是 由 于 随机 因素 而 是 由 于 一 些 其 他 因素 ?” 如 
果 查 阅 附 录 B 的 正 态 曲 线 表 你 会 知道 z 值 的 临界 点 1.65 包含 了 曲线 覆盖 
面积 的 45% ,如 果 与 曲线 另 一 侧 覆 盖 面 积 的 50% 加 起 来 ,就 得 到 全 部 面积 
的 95% 。 也 就 是 在 x 轴 的 这 一 点 之 上 留 下 了 5% 。 任 何 表示 z 值 1.65 或 
这 个 值 以 上 的 数值 就 在 很 小 的 区 域内 或 者 至 少 是 分 布 在 出 现 的 概率 
小 于 其 他 数值 的 区 域内 。 


假设 检验 和 xz 值 :第 一 步 


我 们 所 要 说 的 是 任何 事件 都 有 相应 的 发 生 概 率 。 我 们 使 用 这 些 概 率 
值 来 推断 我 们 预期 的 某 个 事件 不 出 现 的 可 能 性 。 例 如 ,抛掷 10 次 硬币 出 
现 1 次 正面 9 次 反面 的 可 能 性 就 很 小 。 我 们 也 说 过 如 果 事 件 的 发 生 100 
次 中 只 有 5 次 (5% ) ,我 们 就 可 以 认为 相对 于 其 他 可 能 发 生 的 事件 来 说 这 
个 事件 更 不 可 能 发 生 。 

研究 假设 相关 的 结论 当然 也 同样 如 此 。 零 假设 ( 见 第 6 章 ) 认 为 群体 
或 变量 之 间 没 有 差异 ,而 且 发 生 的 可 能 性 是 100% 。 我 们 要 尽力 检验 零 假 
设 可 能 存在 的 错误 。 

换 句 话说 ,如 果 通 过 研究 假设 的 检验 我 们 发 现 事 件 发 生 的 可 能 性 是 极 
值 ,那么 研究 假设 就 是 更 有 力 的 解释 而 不 是 零 假 设 。 因 此 ,如 果 我 们 发 现 
z 值 是 极 值 (发 生 概率 小 于 5% 就 是 极 值 ) ,我 们 就 会 说 极 值 出 现 的 原因 不 
是 由 于 随机 因素 而 是 与 某 种 关系 或 者 某 种 处 理 方式 有 关 。 我 们 会 在 接 下 
来 的 章节 更 详细 地 讨论 这 一 点 。 


使 用 计算 机 计算 z 值 





SPSS 真 的 可 以 完成 很 多 任务 ,但 是 在 这 你 会 看 到 使 用 这 个 软 
©. 件 计算 z 值 是 多 么 节省 时 间 。 你 已 经 知道 如 何 手 动 计算 z 值 ,现在 
使 用 SPSS 来 计算 。 

应 用 SPSS 计算 图 7.6 中 第 一 列 所 示 的 数据 集 ( 也 是 本 章 之 前 
所 示 数 据 ) 的 z 值 ,步骤 如 下 。 

1. 在 新 的 SPSS 窗口 输入 数据 。 





NO 
о 
Ñ, 
ұм! 
і 


方法 名 上 统计 学 


2. 点 击 Analyze 一 Descriptive Statistics 一 Descriptive。 

З. 双击 变量 名 将 变量 移 到 Variable(s) 框 。 

4. 在 Descriptive 对 话 框 点 击 Save Standardized values ав varia- 
bles, 

5. Mth ОК, 


EI Untitled - SPSS Data Editor 


zlaja зі 2121916 


图 7.6 使 用 SPSS 计算 z 值 
你 可 以 在 数据 显示 窗口 看 到 SPSS 数据 如 何 计算 对 应 的 z 值 。 
(注意 一 一 SPSS 在 完成 所 有 的 过 程 后 ,会 自动 进入 结果 输出 窗口 ， 
但 在 输出 窗口 看 不 到 z 值 ! 你 必须 转换 到 数据 显示 窗口 。) 








小 结 
理解 整个 推论 统计 的 最 初 的 和 最 重要 的 技能 就 是 可 以 计算 z 值 并 能 够 估计 
在 一 个 样本 数据 中 某 个 数值 出 现 的 可 能 性 。 一 旦 我 们 知道 考试 成 绩 或 者 组 间 差 
异 发 生 的 可 能 性 ,我 们 就 能 将 这 个 可 能 性 和 我 们 随机 预期 的 可 能 性 进行 比较 ,并 
进一步 得 出 推论 结论 。 在 《 爱 上 统计 学 》 第 凡 部 分 的 开始 ,我 们 将 这 个 模型 应 用 
到 检验 差异 性 问题 的 特定 案例 中 。 
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练习 时 间 
1. 正 态 曲 线 : 
a. 正 态 曲线 的 特征 是 什么 ? 
b. 人 类 的 哪些 行为 .特性 或 特征 的 分 布 是 正 态 的 ? 
2. 为 什么 z 值 是 标准 化 的 值 ? 为 什么 z 值 可 以 用 于 比较 不 同 数据 分 布 的 


3. 计算 下 面 的 均值 为 50 ,标准 差 为 5 的 数据 分 布 的 原始 数值 的 z 值 。 
а.55 
Ь.50 
с. 60 
4.57.5 
е.46 
4. 问题 4a 到 4b 依据 均值 为 75 ,标准 差 为 6.38 的 数据 分 布 来 回答 。 绘 制 一 
个 简 图 来 确定 你 需要 怎么 做 。 
. 一 个 数值 落 在 原始 数值 70 和 80 之 间 的 概率 是 多 少 ? 
. 一 个 数值 落 在 原始 数值 80 以 上 的 概率 是 多 少 ? 
. 一 个 数值 落 在 原始 数值 81 Яп 83 之 间 的 概率 是 多 少 ? 
. 一 个 数值 落 在 原始 数值 63 以 下 的 概率 是 多 少 ? 


о о 可 р 


练习 参考 答案 

la. 对 于 正 态 曲线 ,均值 、 中 位 数 和 众 数 相等 ;曲线 是 以 均值 为 中 心 对 称 的 ; 
曲线 尾 是 渐 近 的 。 

1b. 例如 身高 、 体重、 智力 或 问题 解决 能 力 。 

2. 因为 z 值 是 基于 不 同 数据 分 布 的 离散 度 计 算 的 ,所 以 是 标准 化 的 值 ( 可 以 
与 其 他 同类 型 数值 比较 )。 因 为 z 值 是 测量 均值 和 横 轴 上 其 他 数据 点 之 间 的 距 
离 ( 不 论 数 据 分 布 之 间 在 均值 和 标准 差 上 的 具体 差异 如 何 ) ,使 用 相同 的 单位 ( 标 
准 差 单位 ) ,因而 他 们 能 够 相互 比较 。 

За.2= (55 —50)/5.= +1.00 

3b. z = (50 -50)/5=0 

3c.z = (60 -50)/5 = +2.00 

34.:-(57.5-50)/5- +1.5 

3e. z = (46 —50)/5 = -0.8 

4а. 一 个 数值 落 在 原始 数值 70 和 80 之 间 的 概率 是 .5646。 原 始 数 值 70 的 z 
值 是 —.78,80 的 z 值 是 .78。 均 值 与 z 值 .78 之 间 曲 线 覆 盖 的 面积 是 28.23% „ 
这 两 个 z 值 之 间 曲 线 覆 盖 的 面积 是 28.32% x2, 或 56.46% 。 

4b. 一 个 数值 落 在 原始 数值 80 以 上 的 概率 是 .2167。 原 始 数值 80 的 z 值 是 
.78。 均 值 与 ,z 值 .78 之 间 曲 线 覆 盖 的 面积 是 28.23% , z 18.78 之 下 曲线 覆盖 的 
面积 是 .50 + .2833 ,或 .7833。 曲 线 覆 盖 的 总 面积 1 Яп. 7833 之 间 的 差 是 . 2167 ， 
或 21.67% 。 

4с. 一 个 数值 落 在 原始 数值 81 Яп 83 之 间 的 概率 是 .068。 原 始 数 值 81 的 z 
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值 是 .94 ,83 的 z 值 是 1.25。 均 值 与 z 值 .94 之 间 曲 线 覆 盖 的 面积 是 32.649% , 38 
值 与 z 值 1.25 之 间 曲 线 覆 盖 的 面积 是 39.44% 。 这 两 个 z 值 之 间 曲 线 覆 盖 的 面 
积 是 .3944 - . 3264 = . 068 ,或 者 6.8% 。 

Де. 一 个 数值 落 在 原始 数值 63 以 下 的 概率 是 .03。 原 始 数值 63 的 z 值 是 
-1.88。 均 值 与 z 值 -1.88 之 间 曲 线 和 覆盖 的 面积 是 46.99% 。z 值 -1.88 之 下 曲 
线 覆 盖 的 面积 是 1-(.50+.4699) =.03 ,或 者 3% 。 
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ЖҮ 部 分 


你 已 经 学 到 这 里 , 而 且 仍 然 充 满 活 力 , 所 以 要 恭喜 你 。 到 现在 为 止 ,你 已 经 
很 好 地 掌握 了 描述 统计 是 什么 ,偶然 性 因素 在 决策 中 如 何 影响 结果 ,以 及 由 于 偶 
然 性 因素 和 处 理 方法 的 不 同 , 结 果 出 现 的 可 能 性 是 如 何 的 。 

你 是 建立 和 理解 假设 在 社会 和 行为 科学 研究 中 所 扮演 的 角色 的 专家 。 现 在 
就 是 实践 的 时 候 了 。 让 我 们 看 看 在 ( 爱 上 统计 学 》 接 下 来 的 部 分 会 学 到 什么 。 最 
重要 的 是 你 曾经 付出 的 努力 会 以 理解 具体 的 问题 而 得 到 快速 的 补偿 。 

这 部 分 的 主要 内 容 是 理解 和 应 用 特定 的 统计 类 型 来 回答 特定 类 型 的 研究 问 
题 。 我 们 会 介绍 最 常用 的 统计 检验 ,也 介绍 一 些 稍微 复杂 的 统计 检验 类 型 。 在 
最 后 部 分 会 介绍 一 些 比较 常用 的 统计 软件 包 , 这 些 统计 软件 包 可 用 于 计算 那些 
我 们 用 老式 的 计算 软件 计算 的 相同 的 值 。 

我 们 以 显著 性 概念 的 简短 讨论 开始 ,然后 逐步 演示 推论 统计 。 接 着 就 是 特 
定 检验 的 案例 。 这 一 章 需 要 动手 的 内 容 挺 多 ,现在 就 开始 吧 。 


ЖЛ ТЕЙ) ШЖ 
对 你 我 来 说 意味 者 什么 








本 章 你 会 学 到 什么 


° 显著 性 的 概念 和 显著 性 的 重要 性 

° 第 一 类 错误 和 第 二 类 错误 的 重要 性 和 两 者 之 间 的 区 别 
e 如 何 进行 推论 统计 

e 如 何 为 了 一 定 的 目的 选择 适当 的 统计 检验 


显著 性 的 概念 


对 于 初学 统计 学 的 学 生来 说 可 能 没有 哪 一 个 概念 或 词汇 比 统计 显著 
性 更 让 人 迷惑 了 。 但 是 ,对 你 来 说 这 并 不 意味 着 事实 就 是 如 此 。 虽 然 统计 
显著 性 是 非常 有 影响 的 概念 ,但 是 也 很 简单 ,基础 统计 学 课 上 的 任何 学 生 
都 可 以 理解 。 

我 们 需要 用 研究 案例 来 说 明 我 们 总 结 的 要 点 。 例 如 达 科 特 和 理 查 德 
(E. Duckett & M. Richard) 的 “单亲 母亲 家 庭 中 母亲 的 职业 和 青少年 的 日 
常 经 验 (Maternal Employment and Young Adolescents’? Daily Experiences іп 
Single-Mother Families) ” (1989 年 密苏里 州 堪萨斯 ,儿童 发 展 研 究 协 会 论 
文 ) 。 他 们 调查 了 436 个 5 年 级 到 9 年 级 的 青少年 对 母亲 就 业 的 态度 。 

特别 的 是 他 们 调查 了 母亲 有 工作 和 没 工作 的 青少年 在 态度 上 是 否 存 
在 差异 。 他 们 也 检验 了 其 他 因素 ,但 是 就 这 个 案例 来 说 ,我 们 关注 的 是 有 
工作 的 母亲 和 没有 工作 的 母亲 之 间 的 群体 差异 。 再 加 一 项 内 容 就 是 在 是 
否 存在 差异 的 讨论 中 增加 显著 性 ,因此 我 们 的 研究 假设 类 似 如 下 的 陈述 : 


依据 情绪 状态 的 测量 ,母亲 工作 和 不 工作 的 青少年 对 母亲 就 业 的 态度 
具有 显著 性 差异 。 


我 们 所 说 的 显著 性 的 含义 是 指 两 个 群体 的 态度 之 间 的 任何 差异 是 由 
于 系统 因素 的 影响 而 不 是 偶然 性 因素 。 在 这 个 案例 中 ,影响 因素 是 母亲 是 
否 工 作 。 我 们 假定 控制 了 可 能 影响 两 个 群体 之 间 差 异 的 所 有 其 他 因素 。 
因此 ,余下 的 解释 青少年 态度 差异 的 唯一 因素 就 是 母亲 是 否 工 作 。 这 就 是 
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正确 的 解释 ? 是 的 ,但 是 还 不 完全 。 


是 否 只 有 我 们 是 完美 的 


我 们 的 世界 并 不 完美 ,所 以 我 们 在 一 定 程度 上 确信 我 们 确定 的 引起 群 
体 间 差异 的 那些 因素 时 要 留 有 余地 。 换 句 话说 ,你 需要 表明 即使 你 很 确信 
两 个 育 少 年 群体 之 间 的 差异 是 由 于 母亲 的 就 业 状态 引起 的 ,但 是 你 不 能 
100% ` 绝 对 地 .肯定 地 无 可 置疑 或 毫 不 含糊 地 确信 这 一 点 。 你 的 结论 是 
错误 的 可 能 性 始终 存在 ,不论 这 个 可 能 性 多 小 。 

为 什么 ? 原因 很 多 。 例 如 ,有 可 能 你 的 结论 完全 错误 。 也 许 在 这 次 研 
究 中 ,青少年 的 态度 差异 不 是 由 于 母亲 工作 或 不 工作 引起 的 ,而 是 由 于 其 
他 没有 注意 到 的 解释 因素 ,例如 地 方 就 业 母 亲 俱 乐 部 举办 的 演讲 ,一 些 学 
生 加 入 了 这 样 的 俱乐部 。 如 果 一 个 青少年 群体 的 成 员 几 乎 都 是 男性 而 另 
一 个 青少年 群体 的 成 员 几 乎 都 是 女性 的 情况 下 又 该 是 怎样 的 结论 ? 这 也 
可 能 是 差异 的 来 源 。 如 果 你 是 优秀 的 研究 者 也 进行 了 一 定 的 研究 ,你 可 以 
解释 差异 ,但 是 总 有 可 能 你 做 不 出 解释 。 作 为 优秀 的 研究 者 你 必须 考虑 这 
种 可 能 性 的 存在 。 

那么 你 要 怎么 做 ? 在 大 多 数 涉及 假设 检验 (例如 这 里 的 案例 中 的 群 
体 差异 ) 的 科学 研究 中 一 定 存 在 一 定数 量 的 不 能 控制 的 误差 一 一 这 也 是 
前 面 几 章 已 经 讨论 过 的 偶然 性 因素 。 你 愿意 承担 的 风险 水 平 或 者 概率 水 
平 就 是 显著 水 平 ,这 个 词 不 会 给 人 们 带 来 内 心 的 恐惧 。 

显著 水 平 (significance level, 这 里 是 快捷 简单 的 定义 ) 是 不 能 100% 确 
信 实 验 中 观察 到 的 结果 是 由 于 处 理 因 素 或 需要 检验 的 因素 引起 的 在 
我 们 的 案例 中 是 母亲 是 否 工 作 一 一 所 要 承担 的 风险 。 如 果 你 看 到 的 陈述 
是 显著 性 结论 是 在 .05 概率 水 平 下 (或 者 更 专业 的 说 p<.05 ,在 专业 期 刊 
中 你 会 经 常 看 到 ) , 换 句 话说 就 是 20 次 中 有 1 次 (或 .05 ,或 5% ) 所 发 现 的 
任何 差异 不 是 由 于 假定 的 原因 (母亲 是 否 工 作 ) ,而 是 由 于 其 他 未 知 的 原 
因 引 起 的 。 你 的 工作 就 是 尽 可 能 减少 这 种 可 能 性 ,消除 所 有 可 能 引起 观察 
到 的 任何 差异 的 其 他 原因 。 因 为 你 不 可 能 完全 消除 这 种 可 能 性 (因为 没 
有 人 能 够 控制 所 有 潜在 的 因素 ) ,必须 分 配 一 定 的 概率 水 平 ,并 谨慎 地 陈 
述 结 论 。 

总 之 (实际 上 也 是 如 此 ) ,研究 者 定义 了 他 或 者 她 愿意 承担 的 风险 水 
平 。 如 有 果 结 果 落 在 这 个 范围 内 ,也 就 是 说 “这 不 是 偶然 出 现 的 一 一 而 是 有 
其 他 因素 在 产生 影响 ” ,研究 者 就 会 知道 零 假 设 (表达 式 是 等 式 ) 不 是 观察 
到 的 结果 的 最 有 力 的 解释 。 相 反 研 究 假设 (也 就 是 说 是 不 等 式 ,或 者 说 存 
在 差异 ) 是 可 选择 的 解释 。 

现在 来 看 另 一 个 案例 ,这 是 假设 的 案例 。 

研究 者 有 兴趣 了 解 参与 学 前 项 目的 孩子 与 没有 参与 的 孩子 在 学 习 成 
绩 上 是 否 存 在 差异 。 零 假设 是 两 个 群体 的 学 习 成 绩 相 等 。 
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研究 假设 是 参与 学 前 项 目的 孩子 的 平均 成 绩 高 于 没有 参与 项 目的 孩 
子 的 平均 成 绩 。 

作为 一 个 优秀 的 研究 者 ,你 的 工作 就 是 表明 ( 尽 你 所 能 一 一 没有 人 可 
以 完美 地 解释 任何 事物 ) 两 个 群体 之 间 存 在 的 任何 差异 仅仅 是 由 于 学 前 
项 目的 影响 ,而 不 是 任何 其 他 因素 或 者 因素 的 组 合 。 你 可 以 使 用 一 些 技术 
(你 会 在 高 一 级 的 统计 学 课程 中 学 习 ) 控制 或 者 消除 影响 差异 的 所 有 可 能 
的 原因 ,如 父母 教育 水 平 . 家 中 孩子 的 数量 等 的 影响 。 一 旦 消除 了 其 他 洪 
在 的 解释 变量 ,唯一 留 下 的 对 差异 的 解释 就 是 学 前 经 验 的 影响 。 

但 是 你 可 以 绝对 地 确定 吗 ? 不 ,你 不 可 以 。 为 什么 ? 首先 ,你 不 能 确 
定 你 所 研究 的 样本 能 够 很 好 地 代表 总 体 。 而 且 即 使 样本 能 很 好 地 代表 总 
体 ,也 总 是 存在 影响 结论 的 影响 因素 ,而 且 在 设计 试验 的 过 程 中 你 总 会 无 
意 中 遗 漏 这 些 因素 。 研 究 中 始终 存在 错误 的 可 能 性 。 

如 果 推 断 考试 成 绩 的 差异 是 由 于 经 历 的 不 同 , 就 得 接受 一 定 的 风险 。 
实际 上 (给 点 掌声 鼓励 ) 风险 水 平 就 是 你 愿意 执行 的 统计 显著 性 水 平 。 

统计 显著 性 ( statistical significance, 这 里 是 正式 的 定义 ) 是 指 零 假设 为 
真 的 情况 下 拒绝 零 假设 所 要 承担 的 风险 水 平 。 就 上 面 的 例子 来 说 , 零 假 设 
是 两 个 样本 群体 之 间 没 有 差异 ( 记 住 , 零 假设 始终 以 等 式 的 形式 表述 )。 
但 是 在 给 你 们 的 数据 中 ,你 们 会 发 现 差异 确实 存在 。 也 就 是 考虑 到 目前 你 
们 找到 的 证 据 的 情况 下 ,群体 成 员 的 身份 似乎 对 学 习 成 绩 有 影响 。 但 是 在 
真实 的 世界 中 却 可 能 没有 差异 。 如 果 你 拒绝 了 你 陈述 的 零 假设 ,你 就 犯 了 
一 个 错误 。 犯 此 类 错误 你 可 能 承担 的 风险 (或 者 说 显著 水 平 ) 就 是 人 们 熟 
知 的 第 一 类 错误 。 


世界 上 最 重要 的 表格 ( 只 对 这 一 学 期 而 言 ) 


下 面 是 简要 的 概括 。 

零 假设 可 能 是 真实 的 也 可 能 是 虚假 的 。 两 个 群体 之 间 可 能 真 的 没有 
差异 ,也 可 能 真 的 确实 是 不 相等 的 (如 两 个 群体 之 间 存 在 差异 ) 。 但 是 要 
记 住 你 永远 不 会 知道 真实 的 状况 ,因为 零 假 设 不 能 直接 检验 ( 记 住 零 假设 
只 应 用 于 总 体 ) 。 

实际 上 ,作为 优秀 的 统计 学 者 你 既 可 以 选择 拒绝 也 可 以 接受 零 假设 ， 
对 吧 ? 一 共有 四 种 情况 ,你 可 以 在 表 8. 1 中 看 到 。 

现在 就 来 看 看 表 中 的 每 一 格 。 


关于 表 8.1 内 容 更 多 的 讨论 


表 8.1 中 的 四 个 重要 的 格 描 述 了 零 假设 的 性 质 ( 真实 的 或 虚假 的 ) 和 
相应 的 选择 (接受 或 拒绝 零 假设 ) 之 间 的 关系 。 就 如 你 能 看 到 的 , 零 假设 
可 能 是 真实 的 也 可 能 是 虚假 的 ,而 你 可 能 拒绝 也 可 能 接受 它 。 

对 于 理解 这 个 表 来 说 最 重要 的 事实 是 研究 者 永远 不 知道 零 假设 的 真 
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实 性 质 , 以 及 群体 之 间 真 的 存在 或 者 不 存在 差异 。 为 什么 ? 因为 总 体 ( 和 雪 
假设 所 表示 的 ) 不 能 直接 检验 。 为 什么 ? 这 样 做 是 不 现实 的 ,而 这 也 是 为 





什么 我 们 有 推论 统计 。 
表 8.1 不 同类 型 的 错误 
可 能 的 选择 
接受 零 假 设 拒绝 零 假 设 
零 假 设 是 1 2 
真实 的 @ 对 啦 , 零 假设 是 真实 的 情 ” 哎 一 你 犯 了 第 一 类 错误 ， 
况 下 你 接受 了 零 假设 ,而 且 ”在 群体 之 间 没 有 差异 的 情 
群体 之 间 没 有 差别 。 况 下 拒绝 了 零 假设 。 第 一 
零 假 设 的 类 错误 也 可 以 用 希腊 字母 
真实 性 质 阿拉 法 ,或 a 表示。 
零 假 设 是 3 4 
虚假 的 @ 很 好 ,在 群体 之 间 存 在 


哦 一 你 犯 了 第 二 类 错误 , 接 
受 了 虚假 的 零 假 设 。 第 二 
类 错误 也 可 以 用 希腊 字母 
贝塔 ,或 B 表示 。 


差异 的 情况 下 你 拒绝 了 和 零 
假设 。 也 可 以 叫做 检定 
力 ,或 1-B。 





ө 表 8.1 中 格子 1 表示 的 状况 是 , 零 假 设 是 真实 的 (群体 之 间 没 有 差 
异 ) 情 况 下 研究 者 做 出 了 接受 的 正确 选择 。 这 里 没有 问题 。 在 我 
们 的 案例 中 ,我 们 的 结论 表明 两 个 孩子 群体 之 间 没 有 差异 , 而 我 们 
接受 了 零 假 设 也 就 是 没有 差异 的 正确 选择 。 

o 格子 2 表示 的 是 严重 的 错误 。 这 里 我 们 拒绝 了 和 零 假 设 ( 也 就 是 没有 
差异 ) ,而 零 假 设 实 际 上 是 真实 的 ( 即 没 有 差异 ) 。 两 个 孩子 群体 之 
间 没 有 差异 ,但 是 我 们 得 出 的 结论 是 有 差异 ,这 是 一 种 类 型 的 错误 。 
这 就 是 人 们 所 说 的 第 一 类 错误 (Type I error) ,也 就 是 显著 水 平 。 

ө 还 存在 一 类 错误 。 格 子 3 也 表示 一 种 严重 的 错误 。 这 里 我 们 已 经 
接受 了 零 假设 (也 就 是 没有 差异 ) ,而 零 假 设 实 际 上 是 虚假 的 ( 即 实 
际 上 存在 差异 ) 。 我 们 已 经 说 过 两 个 孩子 群体 之 间 有 差异 ,但 是 我 
们 得 出 的 结论 是 没有 差异 。 很 明显 这 就 是 人 们 熟知 的 第 二 类 错误 
(Туре П error). 

8.1 中 的 格子 4 表示 的 状况 是 在 零 假 设 实际 上 是 虚假 的 情况 下 ， 
研究 者 做 出 了 拒绝 的 正确 决定 。 这 里 没有 问题 。 在 我 们 的 案例 中 ， 
我 们 的 结论 表明 两 个 孩子 群体 之 间 有 差异 ,而 且 我 们 做 出 了 拒绝 表 
述 为 没有 差异 的 零 假 设 的 正确 选择 。 
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地 拒绝 虚假 的 零 假设 以 至 于 会 错过 了 正确 的 零 假设 。 这 样 严 格 的 
第 一 类 错误 的 发 生 率 留 下 的 余地 很 小 一 一 实际 上 研究 假设 可 能 是 
正确 的 ,但 是 相应 的 概率 水 平 是 .015 一 一 非常 少见 ,但 是 由 于 严格 
的 第 一 类 错误 而 错过 了 。 


@ 如 果 . 05 是 好 的 ,那么 .01 更 好 ,为 什么 不 把 第 一 类 错误 的 风 
9» 险 水 平定 在 .000001? 对 于 每 一 个 好 的 解释 来 说 ,有 了 时 你 如 此 严谨 
() 





回顾 第 一 类 错误 


我 们 现在 把 重点 更 多 地 放 在 格子 2 上 ,也 就 是 犯 了 第 一 类 错误 , 因为 
这 是 我 们 讨论 的 重点 。 

第 一 类 错误 或 者 说 显著 水 平 具 有 特定 的 值 ,而 且 与 任何 零 假 设 检验 中 
定义 的 你 愿意 承担 的 风险 联系 在 一 起 。 一 般 设 置 的 显著 水 平 是 在 . 01 与 
.05 之 间 。 

例如 ,如 果 显 著 水 平 是 .01, 这 意味 着 在 任何 一 个 零 假设 检验 中 ,只 有 
1% 的 可 能 性 是 零 假设 为 真 ,而 你 拒绝 了 零 假设 ,并 且 在 群体 之 间 实 际 上 根 
本 没有 差异 的 情况 下 得 出 群体 之 间 有 差异 的 结论 。 

如 果 显 著 水 平 是 . 05 ,这 意味 着 在 任何 一 个 零 假 设 检验 中 ,只 有 5% 的 
可 能 性 是 零 假 设 为 真 ,而 你 拒绝 了 零 假 设 (并 得 出 群体 之 间 有 差异 的 结 
论 ) ,而 实际 上 根本 没有 群体 间 差 异 。 要 注意 的 是 显著 水 平 与 零 假设 的 独 
立 性 检验 相关 ,而 且 不 可 以 说 “对 零 假设 的 100 次 检验 中 我 犯 了 5 次 或 总 
数 中 5% 的 错误 。” 

在 最 近 的 研究 报告 中 ,统计 显著 性 通常 以 p <. 05 表示 ,可 以 读 作 “ 观 
察 到 这 种 结果 的 概率 小 于 . 05” ,在 专业 文章 的 报告 中 简单 地 表述 为 “在 
.05 的 显著 水 平 下 。” 


ji 依据 很 流行 的 统计 分 析 软 件 的 介绍 ,就 不 再 需要 担心 这 样 的 
SAN | 陈述 如 “p <.05” 或 “p<.01” 的 不 准确 性 一 一 p <. 05 就 意味 着 是 
| () 从 . 000 到 . 049999 的 所 有 值 吗 ? 但 是 类 似 SPSS 的 软件 给 出 了 你 
犯 第 一 类 错误 愿意 承担 的 风险 的 确定 的 概率 如 PP =. 013 ,或 者 p = 
. 158。 因 此 当 你 在 研究 报告 中 看 到 类 似 的 陈述 如 “p <. 05” 时 , 意 
味 着 p 值 是 从 .00 到 . 049999999999 之 间 的 任何 值 (你 会 明白 的 )。 
同样 的 , 当 你 看 到 “p >.05" 或 “p=n.s."( 非 显著 性 ) ,意味 着 拒绝 
真实 的 零 假设 的 概率 超过 . 05 ,实际 上 可 能 性 范围 是 . 0500001 
到 1. 00。 

因此 ,知道 一 个 结果 的 确定 的 概率 是 很 大 的 进步 ,因为 我 们 能 

够 更 准确 地 测量 我 们 愿意 承担 的 风险 。 
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在 第 一 类 错误 之 外 ,你 还 可 能 犯 另 一 类 型 的 错误 ,如 在 表 8.1 中 所 示 。 
当 你 无 意 中 接受 了 虚假 的 零 假设 就 产生 了 第 二 类 错误 ( 表 中 的 格子 3) 。 


当 我 们 讨论 一 项 发 现 的 显著 性 时 ,你 可 能 听 到 检定 力 这 个 词 
JO 的 使 用 。 检 定 力 是 关于 统计 检验 如 何 很 好 检验 和 拒绝 一 个 虚假 的 
零 假设 的 概念 。 从 数学 上 来 说 ,检定 力 就 是 用 1 减 去 第 二 类 错误 


的 值 。 更 有 检定 力 的 检验 总 是 比 相 对 没有 检定 力 的 检验 更 具有 吸 
引力 ,因为 更 有 检定 力 的 检验 可 以 让 你 更 接近 辨别 虚假 的 核心 。 


例如 ,样本 群体 代表 的 两 个 总 体 之 间 存 在 真实 的 差异 ,但 是 你 错误 地 
得 出 差异 不 存在 的 结论 。 

就 理想 状态 而 言 ,你 想 同 时 减少 第 一 一 类 错误 和 第 二 类 错误 ， 但 是 这 总 
是 很 难 实现 ,或 很 难 控制 。 你 已 经 完全 控制 了 第 一 类 错误 的 水 平 或 者 说 你 
愿意 承担 一 定 的 风险 (因为 你 实际 上 设置 了 风险 水 平 ) 。 第 二 类 错误 没有 
直接 控制 ,但 是 第 二 类 错误 与 样本 规模 等 因素 相关 。 第 二 类 错误 对 样本 中 
个 体 的 数量 特别 敏感 , 当 个 体 数 量 增加 时 ,第 二 类 错误 就 越 低 。 换 句 话说 ， 
样本 的 特征 越 是 与 总 体 的 特征 匹配 (可 以 通过 增加 样本 的 规模 提高 )， 你 
接受 虚假 的 零 假设 的 可 能 性 就 越 低 。 


显著 性 与 意义 


对 研究 者 来 说 ,有 趣 的 状况 是 发 现 试验 的 结果 在 统计 上 是 显著 的 。 你 
知道 统计 显著 性 的 含义 一 一 也 就 是 研究 在 统计 上 成 功 了 ,而 且 零 假设 不 是 
发 现 结果 的 合理 解释 。 现 在 ,如 果 你 的 实验 设计 和 其 他 因素 都 经 过 谨慎 的 
考虑 ,统计 上 显著 的 结论 无 可 怀疑 使 你 在 研究 领域 做 出 贡献 迈 出 了 第 一 
步 。 但 是 ,统计 显著 性 的 值 和 其 重要 性 或 意义 必须 认真 考虑 。 

例如 ,我 们 面 对 的 情况 是 将 规模 非常 大 的 不 识字 的 成 年 人 (大 概 
10 000 人 ) 样 本 分 成 两 组 。 一 组 通过 使 用 电脑 来 接受 集中 的 阅读 训练 , 另 
外 的 一 组 通过 课堂 教学 来 接受 集中 的 阅读 训练 。 组 1( 在 课堂 中 学 习 ) 的 
阅读 测验 的 平均 成 绩 ,也 就 是 被 解释 变量 是 75.6, 组 2( 使 用 电脑 学 习 ) 的 
平均 成 绩 是 75.7。 两 组 的 方差 的 数量 几乎 相等 。 就 如 你 所 能 看 到 的 ,成 
绩 均 值 的 差异 只 有 十 分 之 一 点 (75.6 与 75.7) ,但 是 对 独立 均值 之 间 的 显 
著 性 进行 1 检验 时 ,结果 在 . 01 的 水 平 是 显著 的 ,这 表明 电脑 学 习 者 比 教室 
教学 学 习 者 学 得 更 好 。( 接 下 来 的 两 章 讨论 上 检验) 

两 组 之 间 0.1 的 差异 实际 上 是 统计 显著 的 ,但 是 是 否 有 意义 ? 考试 成 
绩 ( 在 这 么 小 的 范围 内 ) 的 提高 是 否 能 够 为 花费 300 000 美元 建立 这 个 项 
目 提供 充分 的 合理 解释 ? 或 者 说 这 个 差异 无 足 轻 重 可 以 忽略 ,即使 在 统计 
上 是 显著 的 ? 

下 面 列 出 的 是 我 们 依据 这 个 案例 和 其 他 许多 可 能 的 案例 得 出 的 有 关 
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统计 显著 性 的 重要 性 的 结论 。 

。 统计 显著 性 本 身 或 内 部 是 无 意义 的 ,除非 所 执行 的 研究 具有 合理 的 
概念 基础 ,可 以 由 此 推导 结果 显著 性 的 意义 。 

ө 统计 显著 性 不 能 脱离 发 生 的 背景 独立 地 解释 。 例 如 ,如 果 你 是 学 校 
系统 的 管理 者 ,如 果 留 级 项 目 以 半分 之 差 显 著 地 提高 学 生 的 标准 化 
考试 成 绩 , 你 是 否 愿 意 将 学 生 留 在 一 年 级 ? 

e 虽然 统计 学 是 很 重要 的 概念 ,但 不 是 终极 目标 , 当然 也 不 应 该 是 统 
计 研 究 的 唯一 目标 。 这 就 是 为 什么 我 们 以 检验 假设 开始 而 不 是 证 
明 假设 。 如 果 我 们 的 研究 设计 正确 ,那么 甚至 零 假 设 也 会 揭示 重要 
的 信息 。 如 果 特 定 的 处 理 因 素 没 有 产生 影响 ,这 也 是 其 他 人 需要 知 
道 的 重要 信息 。 如 果 你 的 研究 设计 得 很 好 ,接着 你 应 该 知道 为 什么 
处 理 因 素 没有 发 挥 作 用 ,那么 沿 着 这 条 线 研究 的 其 他 人 在 设计 他 或 
者 她 的 研究 时 就 可 以 考虑 你 所 提供 的 有 价值 的 信息 。 


推论 统计 介绍 


描述 统计 是 用 于 描述 样本 的 特征 ,而 推论 统计 是 基于 样本 特征 推断 总 
体 的 某 些 特征 。 

在 4 爱 上 统计 学 》 前 半 部 分 的 几 个 方面 ,我 们 已 经 强调 ,好 的 科学 研究 
的 一 个 标志 就 是 以 这 样 的 方式 选择 样本 ,也 就 是 样本 是 从 中 选择 样本 的 总 
体 的 代表 。 接 着 的 过 程 就 是 推论 ,就 是 基于 样本 的 检验 (和 试验 ) 结 果 从 
较 小 的 样本 群体 推断 较 大 的 群体 。 

在 我 们 开始 讨论 具体 的 推论 检验 之 前 , 先 了 解 推论 方法 应 用 的 逻辑 。 


推论 如 何 进 行 


下 面 是 研究 项 目的 一 般 步 又 ,可 以 了 解 推论 如 何 进行 。 我 们 仍然 以 青 
少年 对 母亲 工作 的 态度 作为 案例 。 

下 面 是 事件 可 能 发 生 的 次 序 。 

1. 研究 者 从 母亲 工作 的 青少年 和 母亲 不 工作 的 青少年 中 选择 代表 性 
样本 。 样 本 选择 的 方式 是 样本 能 够 代表 从 中 选择 的 总 体 。 

2. 每 一 个 青少年 要 进行 一 次 测试 来 评价 他 或 她 的 态度 。 接 着 计算 群 
体 的 均值 并 使 用 一 些 检验 方法 来 比较 。 

3. 可 以 得 出 的 结论 是 成 绩 之 间 的 差异 是 由 于 偶然 性 因素 (也 就 是 母 
亲 工 作 之 外 的 一 些 因素 是 差异 的 原因 ) 引 起 ,或 是 由 于 群体 之 间 “ 真 实 的 ” 
以 及 统计 显著 的 差异 引起 (也 就 是 由 于 母亲 工作 ) 。 

4. 可 以 得 出 的 结论 是 从 中 选择 样本 的 总 体 中 母亲 就 业 和 青少年 态度 
之 间 的 关系 。 换 句 话 说 ,基于 样本 数据 分 析 所 得 结论 进行 的 推论 是 关于 青 
少年 总 体 的 。 
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如 何 选择 用 于 检验 的 方法 


上 面 的 第 三 步 让 我 们 提出 这 个 问题 ,“ 我 如 何 选择 恰当 的 统计 检验 来 
确定 群体 之 间 的 差异 是 否 存在 ?” 检 验方 法 太 多 了 ,你 必须 决定 使 用 哪 一 
种 以 及 何 时 使 用 。 如 何 使 用 哪 一 种 检验 的 最 好 的 学 习 方 式 是 成 为 有 经 验 
的 统计 学 者 一 一 选修 过 许多 这 个 领域 的 课程 而 且 参 与 了 许多 研究 。 经 验 
永远 是 最 好 的 老师 。 实 际 上 没什么 真正 的 学 习 选 用 哪 一 种 以 及 何 时 使 用 
的 方式 ,除非 你 具有 真实 的 实际 应 用 这 些 工具 的 机 会 。 因 此 上 这 门 课 你 就 
在 学 习 如 何 使 用 这 些 特定 的 工具 。 

因此 ,为 了 实现 我 们 目的 并 开始 学 习 , 我 们 建立 了 各 种 工具 的 简易 流 
程 表 (或 速 查 表 ) ,如 图 8.1 所 示 。 你 必须 知道 你 在 做 什么 ,这 样 选择 正确 
的 统计 检验 就 不 完全 是 随意 的 决定 ,当然 也 是 很 好 的 开始 学 习 的 起 点 。 

”不 要 认为 图 8.1 可 以 满足 你 学 习 不 同 的 检验 何 时 是 恰当 的 需要 。 这 
里 的 流程 表 只 是 帮助 你 开始 学 习 。 


如 何 使 用 流程 表 





1 一 假定 你 是 刚 入 门 的 统计 人 员 ( 实 际 上 也 是 ) ,对 显著 性 检验 有 一 
定 的 了 解 , 但 是 对 于 何 时 使 用 哪 一 种 很 迷惑 。 

2 一 回答 流程 表 上 部 的 问题 。 

3 一 依据 对 流程 表 每 一 个 问题 的 回答 进行 选择 ,直到 流程 表 的 末 
端 。 那 就 是 你 应 该 选用 的 统计 检验 。 这 不 是 火箭 科学 ,而 且 经 
过 一 些 实践 (你 可 以 通过 本 书 的 这 一 部 分 来 实践 ) ,你 就 能 够 快 
速 有 效 地 选择 恰当 的 检验 。 本 书 这 一 部 分 的 每 一 章 都 会 以 类 
似 图 8.1 中 所 见 的 流程 表 开 始 , 让 你 经 过 特定 的 步骤 选择 应 该 
使 用 的 统计 检验 。 








ЧЕ, 


5 


显著 性 检验 介绍 


推论 统计 的 优势 就 是 可 以 依据 样本 的 信息 得 出 关于 总 体 的 结论 。 进 
行 推论 的 最 有 用 的 工具 之 一 就 是 统计 显著 性 检验 ,显著 性 检验 可 以 依据 所 
提问 题 的 性 质 和 零 假 设 的 形式 而 应 用 于 不 同 的 情形 。 
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例如 ,你 是 否 想 了 解 两 个 群体 之 间 的 差异 ,如 男孩 的 某 些 考试 的 成 绩 
是 否 与 女孩 的 成 绩 有 显著 差别 ? 或 者 是 两 个 变量 之 间 的 关系 ,如 一 个 家 庭 
中 孩子 的 数量 和 智力 测试 的 平均 成 绩 ? 这 两 个 案例 需要 不 同 的 方法 ,但 是 
两 者 最 后 都 会 使 用 特定 的 统计 显著 性 检验 对 零 假 设 进行 检验 。 


如 何 进 行 显著 性 检验 :计划 


显著 性 检验 是 基于 这 样 的 事实 ,每 一 类 型 的 零 假设 都 与 特定 的 统计 类 
型 联系 在 一 起 。 而 每 一 种 统计 类 型 与 特定 的 分 布 联系 在 一 起 ,你 要 比较 从 
样本 获得 的 数据 的 分 布 。 依 据 样本 特征 与 检验 的 分 布 特征 的 比较 你 可 以 
推断 样本 特征 是 否 不 同 于 预期 的 随机 分 布 特征 。 

下 面 是 任何 零 假设 进行 统计 检验 时 需要 采用 的 一 般 步 又 。 这 些 步骤 
也 是 第 TV 部 分 各 章 的 模式 。 

1. 零 假设 的 陈述 。 你 是 否 记 得 零 假 设 的 陈述 形式 是 等 式 ? 零 假 设 是 
假定 没有 其 他 影响 判断 的 信息 的 情况 下 事件 的 “真实 ”状态 。 

2. 设置 零 假设 的 风险 水 平 (或 者 显著 水 平 ,或 第 一 类 错误 )。 任 何人 研 
究 假设 都 要 设置 你 可 能 错误 的 特定 风险 水 平 。 第 一 类 错误 越 小 (如 .01 
与 .05 相 比 ) ,你 愿意 承担 的 风险 越 小 。 没 有 假设 检验 是 完全 没有 风险 的 ， 
因为 你 永远 不 会 知道 两 个 变量 之 间 的 “真实 "关系 。 要 记 住 按 惯例 第 一 类 
错误 设置 的 概率 水 平 是 .01 或 .05 ;SPSS 和 其 他 软件 设 定 相同 的 概率 水 平 。 

з. 选择 恰当 的 检验 统计 量 。 每 一 个 零 假 设 伴 随 着 特定 的 检验 统计 量 。 
在 本 书 的 这 部 分 你 可 以 知道 什么 样 的 检验 与 什么 样 的 问题 类 型 相 联 系 。 

4. 计算 检验 统计 值 。 检 验 统计 值 (也 叫 实际 值 ) 是 特定 的 统计 检验 的 
结果 。 例 如 ,两 个 群体 的 平均 值 之 间 差 异 的 显著 性 ,相关 系数 与 0 值 之 间 
差异 的 显著 性 ,两 个 比例 值 之 间 差 异 的 显著 性 ,都 需要 进行 统计 检验 ,得 到 
一 个 具体 的 数值 。 

5. 使 用 特定 统计 量 的 统计 临界 值 表 确定 拒绝 零 假 设 需要 的 值 。 每 一 
个 检验 统计 量 ( 同 时 考虑 群体 规模 和 愿意 承担 的 风险 ) 都 有 相应 的 临界 
值 。 这 个 值 是 零 假 设 , 是 真实 的 情况 下 你 预期 的 拒绝 零 假 设 的 统计 检 
验 值 。 

6. 比较 实际 值 和 临界 值 。 这 是 关键 的 一 步 。 就 是 比较 通过 检验 统计 
量 获得 的 值 (你 计算 所 得 的 值 ) 与 你 预期 的 随机 的 情况 下 对 应 的 值 (临界 
fÈ) 。 

7. 如 果实 际 值 大 于 临界 值 ,不 能 接受 零 假设 。 也 就 是 说 , 零 假 设 的 等 
式 陈述 (反映 偶然 性 ) 不 是 我 们 发 现 的 差异 的 最 有 力 的 解释 。 这 也 是 推论 
方法 表现 出 其 优点 的 地 方 。 只 有 实际 值 大 于 随机 状态 对 应 的 值 (也 就 是 
统计 检验 的 结果 不 是 随机 变动 的 结果 ) 你 才 可 以 说 你 发 现 的 任何 差异 不 
是 随机 结果 , 且 零 假设 的 等 式 陈 述 不 是 解释 你 发 现 的 任何 差异 的 最 有 力 的 
解释 。 相 反 ,差异 一 定 是 由 于 处 理 因 素 引 起 。 


110 万 类 方法 ы, ы 


8. 如 果实 际 值 没有 超过 临界 值 , 零 假 设 是 最 有 力 的 解释 。 如 果 你 不 能 
表明 你 发 现 的 差异 是 由 于 偶然 因素 之 外 的 因素 (如 处 理 因 素 ) 引 起 ,那么 
差异 一 定 是 由 于 偶然 因素 或 者 其 他 你 没有 控制 的 因素 引起 。 换 句 话 说 , 零 
假设 是 最 好 的 解释 。 


一 张 图 胜 过 千言 万 语 


在 图 8.2 中 你 可 以 看 到 我 们 刚才 学 习 的 八 个 步骤 的 表述 。 这 是 实际 
值 和 临界 值 比 较 时 不 同情 况 的 图 形 表示 。 在 这 个 案例 中 ,显著 水 平 设置 
为 .05 或 说 5% 。 也 可 以 设置 为 .01 或 1% 。 





所 有 值 的 95% 





不 能 拒绝 零 假设 | кезиш 
临界 值 
图 8.2 比较 实际 值 和 临界 值 ,并 作出 拒绝 或 者 接受 零 假设 的 决定 
1. 整个 曲线 表示 基于 特定 零 假 设 一 一 如 两 个 群体 之 间 的 差异 或 相关 
系数 的 显著 性 一 一 的 所 有 可 能 的 结果 。 
2. 临界 值 是 这 样 的 点 , 即 超过 这 个 点 的 实际 结果 如 此 稀少 ,因此 可 以 
推断 实际 结果 不 是 由 于 偶然 因素 而 是 由 于 其 他 因素 引起 的 。 在 这 个 案例 
中 ,我 们 定义 的 稀少 程度 是 发 生 的 可 能 性 不 足 5% 。 
3. 如 果 结 果 表示 实际 值 落 在 临界 值 的 左边 (就 是 小 于 极 值 ) ,结论 就 
是 零 假 设 是 观察 到 的 任何 差异 的 最 有 力 的 解释 。 换 句 话说 ,实际 值 落 在 这 
个 范围 (曲线 下 面积 的 95% ) ,我 们 只 能 推测 结果 是 由 于 偶然 因素 引起 的 。 
4. 如 果实 际 值 落 在 临界 值 的 右边 (就 是 大 于 极 值 ) ,结论 就 是 研究 假 
设 是 观察 到 的 任何 差异 的 最 有 力 的 解释 。 换 句 话说 ,实际 值 落 在 这 个 范围 
(曲线 下 面积 的 5% ) ,我 们 只 能 推测 结果 是 由 于 偶然 因素 之 外 的 因素 引 
起 的 。 
— S а са АИ 
小 - 结 
现在 你 已 经 明确 地 了 解 了 显著 性 概念 如 何 应 用 ,余下 的 工作 就 是 将 显著 性 
概念 应 用 到 不 同 的 研究 问题 中 。 这 也 是 下 一 章 开 始 的 内 容 , 也 会 在 本 书 这 一 部 
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分 的 大 部 分 章节 中 继续 。 


练习 时 间 
1. 为 什么 显著 性 是 研究 和 应 用 推论 统计 的 重要 概念 ? 
2. 下 面 的 陈述 有 什么 问题 ? 
a. 第 一 类 错误 是 .05 意味 着 100 次 中 有 5 次 我 会 拒绝 真实 的 零 假 设 。 
b. 将 第 一 类 错误 设置 为 0 是 可 能 的 。 
c. 第 一 类 错误 的 概率 水 平 越 小 ,结果 越 好 。 
3. 偶然 性 为 何 与 研究 假设 的 显著 性 检验 有 关 ? 


练习 参考 答案 

1. 显著 性 概念 是 研究 和 应 用 推论 统计 的 关键 ,因为 显著 性 (反应 到 显著 水 平 
方面 ) 设置 了 我 们 确信 我 们 观察 的 结果 是 “真实 ”的 水 平 , 以 及 在 多 大 程度 上 这 些 
结果 可 以 一 般 化 到 从 中 选择 样本 的 更 大 的 和 群体。 

2a. 显著 水 平 只 用 于 单一 的 \ 独 立 的 零 假 设 检验 ,而 不 是 多 元 检验 。 

2b. 不 可 能 将 第 一 类 错误 的 概率 水 平 设置 为 0, 因 为 我 们 可 能 在 零 假 设 实际 
上 是 真实 的 情况 下 拒绝 零 假 设 。 这 种 可 能 性 总 是 存在 。 

2с. 零 假 设 是 真实 的 情况 下 拒绝 零 假 设 你 愿意 承担 的 风险 水 平 , 与 研究 结果 
的 意义 没有 关系 。 你 可 能 得 到 显著 水 平 很 高 的 结果 ,但 是 没有 意义 ,或 者 第 一 类 
错误 的 概率 水 平 很 高 (.10), 却 是 很 有 意义 的 发 现 。 

3. 偶然 性 反映 在 可 能 拒绝 真实 的 零 假设 时 你 愿意 承担 的 风险 水 平 (第 一 类 
错误 ) 中 。 


两 个 群体 的 1 检验 
不 同 群体 的 均值 检验 ЕЗ 





本 章 你 会 学 到 什么 


e 何 时 使 用 独立 均值 的 上 检验 
e 如 何 计算 观察 值 上 值 
o 解释 1 值 ,理解 1 值 的 含义 


独立 样本 1 检验 介绍 


即使 饮食 亲 乱 因为 其 严重 性 得 到 关注 ,也 很 少 进行 跨 文化 的 症状 的 盛 
行程 度 和 严重 性 的 比较 研究 。 约 翰 . ҮЛЕН ла. 舒 马克 与 纳 特 沃 特 
(John P. Sijostedt ,John f. Shumaker & S. S. Nathawat) 对 297 个 澳大利亚 大 
学 生 和 249 个 印度 大 学 生 进 行 了 这 项 比较 研究 。 每 个 学 生 都 参加 了 饮食 
态度 测试 和 戈 德 法 布 肥胖 式 惧 量 表 测 试 。 然 后 比较 群体 得 分 。 就 澳 大 利 
亚 学 生 和 印度 学 生 的 均值 比较 而 言 ,印度 学 生 的 两 个 测试 的 得 分 都 高 于 澳 
大 利 亚 学 生 。 饮 食 态度 测试 的 结果 是 ts = -4.19,p <.000 1, 戈 德 法 布 . 
肥胖 怒 惯 量 的 测试 结果 是 ku = -7.64,р <.000 1。 

那么 ,结果 意味 着 什么 ? 接着 往 下 读 。 

为 什么 i 检验 用 于 独立 均值 ? 舍 斯 泰 特 和 他 的 同事 的 兴趣 在 于 发 现 
两 个 相互 独立 的 群体 在 一 个 (或 多 个 ) 变量 的 平均 值 上 是 否 有 差异 。 我 们 
所 指 的 独立 性 的 含义 是 两 个 群体 在 任何 方面 都 不 相关 。 研 究 中 的 每 一 个 
参与 者 只 接受 一 次 测试 。 研 究 者 采用 独立 均值 的 :检验 ,依据 对 每 一 个 结 
来 变量 得 出 的 结论 ,两 个 群体 之 间 的 差异 在 等 于 和 小 于 .000 1 的 显著 水 平 
下 是 显著 的 。 这 么 小 的 第 一 类 错误 意味 着 两 个 群体 得 分 的 差异 是 由 群体 
成 员 本 身 之 外 的 因素 引起 的 几率 非常 小 ,在 这 个 案例 中 群体 本 身 的 因素 是 
指 民族 、 文 化 或 者 种 族 。 

是 否 想 了 解 更 多 ? 查阅 约翰: МЕНІ. 舒 马克 与 纳 特 沃 特 
(Sjostedt , Ј. P. ,Shumaker, J. Е. & Nathawat,S. S. ) 1998 年 发 表 在 《社会 心 
理学 杂志 》( Journal of Social Psychology) 138 期 第 3 卷 351 ~357 页 上 的 文 
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章 “ 印度 大 学 生 和 澳大利亚 大 学 生 的 饮食 亲 乱 调查 (Eating disorders among 


Іп ап апа Austrailian university student)” „ 
知识 和 知识 路 径 


下 面 介绍 如 何 使 用 图 9.1 所 示 的 第 8 章 已 经 介绍 的 流程 表 选 择 合 适 的 
统计 检验 ,也 就 是 独立 均值 的 上 检验 。 沿 着 图 9. 1 中 加 黑 的 步骤 就 可 以 。 





1 一 研究 澳大利亚 学 生 和 印度 学 生 之 间 差 异 。 
2 一 每 一 个 参与 者 只 被 测试 一 次 。 





3 一 有 两 个 群体 。 
4 一 合适 的 统计 检验 是 独立 均值 的 :检验 。 
6 几乎 每 一 个 统计 检验 都 有 特定 的 假设 支持 检验 的 使 用 。 例 
BAN 如 ,t 检验 的 一 个 主要 的 假设 是 两 个 群体 中 每 个 群体 的 变化 的 量 是 
б) 相等 的 。 这 是 方差 齐 性 假定 。 如 果 样本 规模 足够 大 就 会 破坏 这 个 


假定 ,小 样本 或 者 假定 的 破坏 都 可 能 导致 自 相 矛盾 的 结果 和 结论 。 
你 不 需要 太 担 心 这 些 假定 ,因为 这 些 内 容 已 经 超过 了 本 书 的 范围 。 
不 过 ,你 应 该 知道 这 样 的 假定 很 少 被 破坏 ,但 这 种 可 能 确实 存在 。 


计算 检验 统计 量 


公式 9.1 是 计算 独立 均值 1 检验 中 i 值 的 公式 。 公 式 的 分 子 是 均值 之 

间 的 差 。 群 体内 和 群体 之 间 的 变化 的 数量 构成 分 母 。 
i a A T (9.1) 
n, — 1)s, + (п, — 1)5,][ л, + n, 

其 中 

X, 表示 群体 1 的 均值 

X, 表示 群体 2 的 均值 

п, 表示 群体 1 中 参与 者 的 数量 

п, 表示 群体 2 中 参与 者 的 数量 

si 表示 群体 1 的 方差 

55 表示 群体 2 的 方差 

公式 中 没有 新 的 内 容 。 重 要 的 只 是 代入 正确 的 值 。 

下 面 的 数据 是 帮助 老年 痴呆 症 患 者 记 住 日 常生 活 秩 序 而 设计 的 项 目 
中 能 够 记 住 的 单词 的 数量 。 群 体 1 是 使 用 视觉 教学 ,群体 2 使 用 视觉 教学 


有 要 上 统计 学 
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和 发 声 训 练 。 我 们 使 用 这 些 数 据 计算 下 面 案例 的 检验 统计 量 。 
群体 1 群体 2 


5 
4 
6 
10 
10 
5 
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下 面 是 著名 的 八 个 步骤 和 t 检验 统计 量 的 计算 。 

1. 零 假设 和 研究 假设 的 表述 。 如 公式 9.2 所 示 , 零 假设 表示 群体 1 和 
群体 2 的 均值 之 间 没 有 差异 。 就 我 们 的 目的 而 言 ,研究 假设 (公式 9.3 所 
z) 表示 两 个 群体 的 均值 之 间 有 差异 。 研 究 假设 是 双 侧 的 无 方向 假设 , 因 
为 研究 假设 只 是 表示 差异 存在 ,而 没有 特定 的 方向 。 

零 假 设 是 

H,: = m (9.2) 

研究 假设 是 

Н,: Х, + X, (9.3) 


2. 设置 零 假设 的 风险 水 平 (或 显著 性 水 平 ,或 第 一 类 错误 )。 风 险 水 
平 或 第 一 类 错误 或 显著 性 水 平 (或 其 他 的 称谓 ) 是 . 05 ,这 完全 由 研究 者 
决定 。 

з. 选择 合适 的 检验 统计 量 。 使 用 图 9. 1 所 示 的 流程 表 ,我 们 确定 合适 
的 检验 方法 是 独立 均值 的 上 检验。 因为 这 两 个 群体 相互 独立 ,所 以 不 是 非 
独立 均值 的 上 检验 (初学 者 常 犯 这 个 错误 )。 

4. 计算 检验 统计 值 (也 叫做 实际 值 )。 现 在 我 们 代入 观察 值 并 进行 计 
算 。 公 式 9.1 是 1 值 公式 。 代 入 具体 的 值 之 后 ,我们 就 得 到 等 式 9.4( 我 们 
已 经 计算 了 均值 和 标准 差 ) 。 


AIP” 5.43 — 5.53 (9.4) 


[0 - 1)3. 42? + (30 - 1)2. елү + 30) 

30 + 30 – 2 30 х 30 
代入 具体 的 数值 之 后 ,公式 9.5 表示 我 们 如 何 得 到 最 后 的 值 -.14( 原 书 此 
处 为 -=.18) 。 因 为 是 用 一 个 较 小 的 值 (群体 1 的 均值 是 5.43 ) 减 去 一 个 较 
大 的 值 (群体 2 的 均值 是 5.53) ,所 以 这 个 值 是 负 值 。 要 记 住 一 点 ,即使 检 
验 是 无 方向 的 ,而 且 任 何 差异 都 是 假定 的 ,差异 的 符号 也 是 无 意义 的 。 


REM ЖЕ ше рон 
г Ж + 123. 21 [8] 


= 一 . 14 (9. 5) 


5. 使 用 特定 的 统计 量 的 临界 值 分 布 表 确定 拒绝 零 假 设 需 要 的 值 。 现 
在 我 们 需要 查阅 附录 В 的 表 B2 , 表 B2 列 出 了 :i 检验 的 临界 值 。 

我 们 可 以 使 用 这 个 数据 分 布 表 来 看 两 个 独立 均值 是 否 不 同 , 这 要 通过 
比较 预期 的 随机 数值 (分 布 表 中 的 值 或 者 临界 值 ) 与 观察 到 的 值 (实际 值 ) 
来 实现 。 

我 们 的 第 一 个 任务 是 确定 自由 度 (degrees of freedom ,df) ,自由 度 近似 
于 样本 规模 。 对 目前 选 定 的 检验 统计 量 来 说 自由 度 是 n, -1+m -1。 因 
此 对 每 一 个 群体 来 说 ,就 是 将 两 个 样本 的 规模 加 起 来 然后 减 去 2。 在 这 个 
案例 中 就 是 30 +30 -2 =58。 这 是 就 这 类 检验 统计 量 的 自由 度 , 但 不 是 对 
其 他 统计 量 也 合适 。 

使 用 这 个 数字 (58) 你 愿意 承担 的 风险 水 平 ( 早 先 定 义 的 .05 ) 以 及 双 
侧 检验 (因为 研究 假设 没有 方向 ) ,你 就 可 以 使 用 上 检验 表 来 查找 临界 值 。 
对 于 显著 水 平 为 .05 、 自 由 度 为 58 的 双 侧 检验 来 说 ,拒绝 零 假 设 需要 的 值 
就 是 … 哦 ! 在 分 布 表 中 没有 自由 度 58 这 个 数值 ! 你 该 做 什么 ? 如 果 选 择 
对 应 自由 度 55 的 值 , 你 会 显得 保守 ,因为 你 使 用 了 小 于 现 有 样本 规模 的 样 
本 对 应 的 值 (临界 值 i 值 会 变 大 )。 

如 果 你 选择 对 应 自由 度 60( 最 接近 58 的 值 ) 的 值 ,你 会 更 接近 总 体 规 
模 ,但 是 选择 60 相对 于 58 而 言 更 为 随意 一 些 。 虽 然 统计 学 家 对 于 这 种 情 
况 该 怎么 做 的 观点 不 同 ,我 们 通常 选择 最 接近 于 实际 样本 规模 的 值 。 因 此 
在 显著 水 平 为 .05 自由 度 为 58 的 情况 下 拒绝 零 假 设 需要 的 值 是 2.001 。 

6. 比较 实际 值 和 临界 值 。 实 际 值 是 -~ . 14 ,拒绝 零 假 设 也 就 是 群体 1 
和 群体 2 取得 的 成 绩 没 有 差异 的 临界 值 是 2.001。 临 界 值 2.001 表示 对 应 
于 这 个 值 ,在 愿意 承担 的 风险 水 平 为 .05 .每 个 群体 30 个 参与 者 的 情况 下 ， 
随机 因素 是 对 两 个 群体 之 间 观 察 到 的 任何 差异 的 最 有 力 的 解释 。 

7. 和 8. 做 出 决定 。 现 在 我 们 该 做 出 决定 了 。 如 果实 际 值 大 于 临界 值 
(参照 图 8.2) 就 不 能 接受 零 假 设 。 如 果实 际 值 没有 超过 临界 值 , 零 假设 就 
是 最 有 力 的 解释 。 在 这 个 案例 中 ,实际 值 ( -.14)( 原 书 为 -.18) 没 有 超 
过 临界 值 (2. 001 ) 一 一 这 个 值 不 够 大 ,我 们 不 能 说 群体 1 和 群体 2 之 间 的 
差异 是 由 于 随机 因素 之 外 的 因素 引起 的 。 如 果实 际 值 等 于 或 者 大 于 
2. 001 ,就 如 投 硬币 试验 中 10 次 有 8,9 或 10 次 都 得 到 正面 一 样 , 这 个 值 太 
大 我 们 不 能 相信 除了 随机 因素 之 外 其 他 因素 没有 发 挥 作用 。 在 投 硬 币 试 
验 中 ,是 不 均匀 的 硬币 一 一 在 这 个 案例 中 ,一 定 有 其 他 更 好 的 方法 来 向 老 
年 人 教授 记忆 能 力 。 

那么 什么 引起 两 个 群体 之 间 这 么 小 的 差异 ? 如 果 我 们 继续 现在 的 讨 
论 , 那 么 可 以 说 差异 是 由 于 抽样 误差 或 者 对 参与 者 成 绩 的 微小 变化 的 四 伟 
五 人 误差 引起 的 。 最 重要 的 是 我 们 可 以 确信 (当然 不 是 100% 确信 ) 不 是 
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由 于 任何 特定 的 因素 使 得 一 个 群体 或 另 一 个 群体 取得 更 好 的 成 绩 。 
那么 如 何 解释 llss) = —.14,р >.05 


ө t 表示 我 们 所 用 的 检验 统计 量 。 

。58 是 自由 度数 值 。 

° -.14 是 实际 值 ,是 使 用 本 章 之 前 给 出 的 公式 计算 所 得 的 值 。 

。p>.05( 实 际 上 是 这 个 简短 表达 式 中 最 重要 的 部 分 ) 表示 对 零 假设 
的 任何 检验 来 说 ,两 个 群体 的 差异 是 由 于 随机 因素 * 的 可 能 性 大 于 
5% 。 同 时 注意 p >.05 E p =n. s. 的 形式 出 现 表 示 非 显著 性 。 


特殊 效果 :差异 是 真实 的 吗 


现在 你 已 经 知道 如 何 检验 两 个 不 同 的 群体 或 者 两 个 独立 群体 的 均值 
差异 。 很 好 ,但 这 还 不 是 全 部 。 

如 果 你 已 经 知道 群体 之 间 具 有 显著 性 差异 ,但 是 投入 64 000 美元 的 
问题 不 仅仅 是 差异 是 否 显 著 , 而 且 是 是 否 有 意义 的 问题 。 我 们 的 问题 是 代 
表 不 同 群体 的 数据 分 布 之 间 的 差异 是 否 足 以 说 明 你 观察 到 的 差异 ,以 及 你 
检验 的 差异 是 真实 的 差异 ! 好 吧 ,现在 进入 效应 量 的 讨论 。 

效应 量 是 对 两 个 群体 之 间 如 何 相 互 不 同 的 测量 一 一 也 是 对 处 理 规 模 
的 测量 。 类 似 于 多 大 才 算 大 。 而 且 计 算 效 应 量 特别 有 趣 的 方面 是 不 考虑 
样本 规模 。 计 算 效 应 量 并 且 对 效应 量 做 出 判断 是 理解 显著 性 结果 的 全 新 
的 维度 。 

现在 看 下 面 的 案例 。 研 究 者 检验 的 问题 是 参与 社区 自助 服务 (例如 
扑克 牌 游 戏 、. 野 外 旅行 等 ) 是 否 提 高 了 美国 老年 人 的 生活 质量 (从 1 到 10 
分 为 十 个 等 级 ) 。 研 究 者 执行 了 为 期 六 个 月 的 服务 项 目 , 在 项 目 期 结束 之 
后 测量 两 个 群体 的 生活 质量 (每 个 群体 由 50 名 80 岁 以 上 的 老人 构成 ,其 
中 一 个 群体 得 到 服务 而 另 一 个 没有 得 到 。) 下 面 是 结果 。 


没有 社区 服务 社区 服务 
均值 7.46 6.90 
标准 差 1.03 1.53 


而 且 结论 是 在 风险 水 平 .034 下 差异 是 显著 的 (也 就 是 p <.05)。 

现在 ,差异 是 显著 的 ,但 是 差异 的 规模 是 多 大 ? 

ЖЕ 15 · ВЕЗЕ ( ЈасоЬ Cohen ) 是 对 效应 量 贡 献 最 大 的 人 ,他 撰写 了 有 
关 效 应 量 最 有 影响 、 最 重要 的 文章 。 他 撰写 的 一 本 非常 重要 非常 有 影响 的 


* 原 书 为 教学 方式 一 一 译 者 注 
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жазы; кешн 


书 (你 的 统计 学 老师 的 书架 上 肯定 有 这 本 书 ) 可 以 指导 研究 者 就 差异 和 变 
量 之 间 的 关系 提出 的 不 同 问题 计算 效应 量 。 下 面 是 具体 介绍 。 


计算 和 理解 效应 量 


与 其 他 统计 技术 一 样 ,计算 效应 量 (effect size) 的 方式 也 有 多 种 。 我 
们 会 介绍 最 简单 最 直接 的 方法 。 你 会 在 我 们 呆 会 儿 就 给 出 的 一 些 文献 中 
对 效应 量 有 更 多 的 了 解 。 
到 目前 为 止 ,最 直接 .最 简单 的 计算 效应 量 的 方式 就 是 以 均值 之 间 的 
差 除 以 任何 一 个 群体 的 标准 差 。 这 样 做 有 一 定 的 风险 一 一 因为 假定 两 个 
群体 的 标准 差 ( 和 方差 ) 相 等 。 就 我 们 上 面 的 案例 来 说 ,我 们 会 这 样 计算 : 
Ж Ай; 


ES sD 


其 中 

ES 表示 效应 量 

X, 表示 群体 1 的 均值 

X, 表述 群体 2 的 均值 

SD 表示 任何 一 个 群体 的 标准 差 

因此 ,在 我 们 的 案例 中 , 
© 7.46 - 6.90 

1. 53 

结果 等 于 .366 ,也 就 是 这 个 案例 的 效应 量 是 .37。 

这 意味 着 什么 ? 科 享 等 人 指出 非常 重要 的 一 点 是 效应 量 的 大 、 中 、 小 
的 范围 。 他 们 使 用 下 面 的 标准 : 

e 小 效应 量 的 范围 是 0.0 ~. 20. 

° 中 等 效应 量 的 范围 是 .20 ~ .50。 

° 大 效应 量 的 范围 是 . 50 及 以 上 。 

我 们 案例 的 效应 量 是 .37 ,属于 中 等 规模 。 但 是 这 实际 上 意味 着 什么 ? 

效应 量 给 我 们 这 样 的 认识 , 即 每 个 群体 相对 于 另 一 个 群体 的 位 置 。 例 
如 ,如果 效应 量 为 0, 就 意味 着 两 个 群体 非常 的 相似 而 且 几 乎 完全 重 
Ж 两 个 数值 分 布 之 间 没 有 差异 。 另 一 方面 ,效应 量 为 1 意味 着 两 个 群 
体 大 约 有 45% (通常 能 达到 这 个 量 ) 重 从 。 而 且 , 就 如 你 所 预期 的 ,效应 量 
越 大 就 意味 着 两 个 群体 重 伙 的 部 分 越 少 。 

ЖЕН > PHF (Jacob Cohen) 的 《行为 科学 的 统计 检定 力 分 析 》( Statis- 
tical Power Analysis for the Behavioral Sciences) ,1967 年 的 第 1 版 和 最 近 的 版 
本 (1988 ) 可 以 从 Lawrence Erlbaum Associates 得 到 ,是 每 一 个 想 了 解 更 多 
而 不 限于 这 里 提供 的 非常 一 般 的 信息 的 人 所 必需 的 。 这 本 书 有 许多 表格 
和 技术 ,可 以 用 于 理解 为 什么 统计 显著 的 发 现 只 是 分 析 工 作 的 一 半 一 一 另 
一 半 是 效应 的 规模 。 


ES 
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` ë 那么 你 真 的 想 对 效应 量 了 解 更 多 。 你 可 以 通过 简单 的 方式 计 

UN 算 效 应 量 , 就 如 我 们 刚才 所 展示 的 (均值 相 减 ,然后 除 以 任何 一 个 

Әр» 标准 差 ) ,或 者 偷 看 坐 在 你 旁边 的 漂亮 同学 。 效 应 量 计算 公式 的 发 
展 就 是 在 上 面 的 ES 等 式 的 分 母 ( 原 书 为 分 子 ) 中 使 用 综合 的 方差 。 
综合 的 标准 差 类 似 于 群体 1 的 标准 差 和 群体 2 的 标准 差 的 平均 
值 。 公 式 如 下 : 





其 中 

ES 表示 效应 量 

X, 表示 群体 1 的 均值 

Х, 表示 群体 2 的 均值 

ol 表示 群体 1 的 方差 

оз 表示 群体 2 的 方差 

如 果 我 们 将 上 面 给 出 的 数字 代入 这 个 公式 ,就 会 得 到 不 同 效 
应 量 .43 一 一 与 我 们 使 用 之 前 给 出 的 更 直接 的 方法 计算 所 得 的 效 
应 量 . 37 差异 很 大 (但 是 都 属于 中 等 规模 效应 ) 。 但 是 这 是 更 准确 
的 计算 方法 ,大 家 应 该 很 好 地 了 解 。 


非常 有 用 的 效应 量 计算 器 


为 什么 不 搭 顺 风车 直接 登录 http://www. uccs. edu ~ lbecker/ psy590/ 
escalc3. мт? 加 州 大 学 的 统计 学 家 李 * 贝克 尔 ( Lee Becker) 发 展 了 效应 量 
计算 器 。 利 用 这 个 计算 器 ,你 只 要 输入 数值 ,点 击 сотрше ,软件 就 会 完成 
接 下 来 的 工作 ,如 图 9.2 所 示 。 谢 谢 贝 克 尔 博士 ! | 


Group 1 Croup 2 


М, [72.4 м, [6.9 
SD, [ 03 SD3 [ 53 


Cohen's d effect-size ғ 
0.38336 0.1882Е 





图 9.2 非常 酷 的 效应 量 计 算 器 


120 /2%%% ара 


使 用 计算 机 进行 ;检验 


SPSS 可 以 帮助 进行 推论 检验 。 现 在 就 运行 我 们 已 经 完成 的 检 
验 并 对 结果 进行 解释 。 我 们 使 用 的 数据 集 名 称 是 第 9 章 数 据 集 1 
( chapter 9 data set 1) 。 利 用 这 些 数据 进行 练习 ,你 可 以 看 到 分 组 
变量 (组 1 或 组 2) 在 第 一 列 ,检验 变量 (记忆 ) 在 第 二 列 。 





1 一 在 数据 编辑 栏 录 和 数据 或 者 下 载 数据 文件 。 要 确保 有 一 列 为 
分 组 数据 ,而 且 在 这 一 列 中 只 有 两 个 组 。 

2 一 点 击 Analyze 一 Compare Means 一 independent-Samples T test, 你 
就 会 看 到 如 图 9.3 所 示 的 独立 样本 :检验 对 话 框 。 


‘Independent-Samples T Test 








图 9.3 ”开始 :检验 分 析 的 对 话 杠 





3 一 点 击 变量 group ,然后 点 击 P> 将 变量 移 到 Grouping Variable(s) 
框 中 。 

4 一 点 击 变量 memtest, 然后 点 击 P> 将 变量 移 到 Test Variable (s) 
Ж. 

5 一 在 定义 分 组 变量 之 前 5Р55 不 可 以 继续 运行 。 这 就 是 告知 SPSS 
变量 group 分 成 几 级 (你 不 会 认为 软件 可 以 如 此 智能 而 发 现 分 
组 层级 吧 ?)。 在 任何 情况 下 , 点击 group (??) ,点击 Define 
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Groups ,在 Goupl 键入 数值 1, Group2 键入 数值 2, 如 图 9.4 所 
示 。 在 定义 之 前 分 组 变量 的 名 称 ( 在 这 个 例子 中 是 group ) 必须 
点 中 变 黑 。 





图 9.4 定义 组 对 话 框 
6 一 点 击 Continue ,接着 点 击 OK,SPSS 就 执行 分 析 过 程 然 后 得 出 图 
9.5 所 示 的 结果 。 


SPSS 输出 结果 的 含义 


SPSS 的 这 项 分 析 的 输出 结果 很 多 ,就 我 们 的 目的 来 说 ,我 们 只 
要 分 析 图 9.5 所 示 的 结果 就 可 以 。 有 三 点 需要 注意 。 
1. 实际 的 上 值 是 - . 137 ,非常 接近 于 我 们 之 前 手动 计算 所 得 的 
值 ( -.14) ,但 是 由 于 四 含 五 人 误差 这 两 个 值 是 不 同 的 。 
2. 自由 度数 值 是 58( 你 之 前 应 用 公式 nn, -1 +n, - 1 BHT 
这 个 值 ) 。 
3. 接 下 来 就 是 重要 的 结果 。 结 果 的 显著 性 水 平 是 . 891 ,或 者 
P=.891, 这 意味 着 就 零 假 设 的 一 项 检验 来 说 , 零 假 设 是 真实 的 情 
况 下 拒绝 零 假设 的 可 能 性 非常 高 (89% ) 1 也 就 是 第 一 类 错误 肯定 
大 于 .05 ,这 样 我 们 在 应 用 p >.05 的 公式 进行 相同 的 分 析 时 就 可 
以 及 早 得 出 结论 。 
1 
小 结 
t 检验 是 进行 真实 的 统计 检验 ,并 从 应 用 的 角度 完整 地 理解 显著 性 的 第 一 
步 。 在 进一步 深入 学 习 之 前 要 确定 你 理解 本 章 的 内 容 。 而 且 可 以 手动 完成 我 们 
要 求 做 到 的 一 些 计算 。 接 下 来 我 们 学 习 相 同 检验 的 另外 一 种 形式 ,不 过 这 项 检 
验 是 对 同一 个 参与 者 群体 进行 两 次 测量 而 不 是 对 不 同 的 两 个 群体 各 进行 一 次 
测量 。 
练习 时 间 
1. 使 用 名 称 为 第 9 章 数据 集 2(chapter9 data2) 的 数据 文件 ,在 .05 的 显著 水 
平 下 检验 研究 假设 ,也 就 是 在 课堂 上 男生 比 女生 更 经 常 举 手 。 使 用 计算 器 手动 
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完成 这 次 练习 。 那 么 就 研究 假设 你 得 出 的 结论 是 什么 ? 记 住 首先 要 确定 这 是 单 
侧 还 是 双 侧 检验 。 

2. 使 用 相同 的 数据 集 ( 第 9 章 数据 集 2) ,在 .01 的 显著 水 平 下 检验 研究 假 
设 ,也 就 是 在 课堂 上 男生 和 女生 举 手 的 次 数 不 同 。 使 用 计算 器 手动 完成 这 次 练 
习 。 那 么 就 研究 假设 你 得 出 的 结论 是 什么 ? 你 使 用 的 数据 和 问题 1 使 用 的 数据 
相同 ,但 是 假设 不 同 (一 个 是 有 方向 的 另 一 个 是 无 方向 的 )。 那 么 结果 会 有 何不 
同 ? 为 什么 ? 

3. 使 用 名 称 为 第 9 章 数 据 集 3(chapter 9 data 3) 的 数据 文件 ,检验 零 假设 ,也 
就 是 农村 居民 和 城市 居民 对 待 武 器 控制 的 态度 相同 。 使 用 SPSS 完成 对 这 个 间 
题 的 分 析 。 


练习 参考 答案 

1. 男生 举 手 次 数 的 均值 是 7.93 ,女生 的 均值 是 5.31。 实 际 上 值 是 3.006 ,在 
.05 的 显著 水 平 下 单 侧 检验 (是 男生 举 手 次 数 多 于 女生 ) 拒 绝 零 假 设 的 临界 上 值 
是 1.701。 那 么 结论 是 什么 ? 男生 举 手 次 数 多 ,在 统计 上 是 显著 的 。 

2. 现在 的 问题 更 有 趣 。 我 们 有 完全 相同 的 数据 ,但 是 假设 却 不 同 。 现 在 的 
假设 是 举 手 次 数 是 不 同 的 (而 不 是 多 或 者 少 ) ,所 以 需要 进行 双 侧 检验 。 因 此 使 
用 附录 表 B2 ,在 .01 的 显著 水 平 下 双 侧 检验 的 临界 值 是 2.467。 实 际 值 3. 006 
(与 分 析 问 题 1 所 得 结果 相同 ) 超 过 了 我 们 的 随机 预期 值 ,而 且 就 这 个 假设 而 言 ， 
男生 和 女生 的 举 手 次 数 不 同 。 因 此 两 项 检验 比较 而 言 ,使 用 相同 的 数据 得 出 相 
同 的 结论 (接受 研究 假设 ) 情 况 下 单 侧 检验 的 结果 ( 见 问题 1) 不 需要 和 双 侧 检验 
结果 一 样 。 

3. SPSS 的 输出 结果 如 图 9.6 所 示 , 农 村 居民 和 城市 居民 对 待 武 器 控制 的 态 
度 没 有 显著 性 差异 (p=.253)。 
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两 个 群体 的 1 检验 
两 个 相关 群体 的 均值 检验 ШОД 


本 章 你 会 学 到 什么 


e 何 时 使 用 非 独 立 均 值 的 寺 检 验 
e 如 何 计 算 观 察 值 t 值 
° 解释 t 值 ,理解 1 值 的 含义 


非 独 立 样 本 :检验 介绍 


如 何 给 孩子 提供 最 好 的 教育 很 明显 是 任何 社会 都 面 对 的 重要 问题 之 
一 。 和 孩子 之 间 差 异 太 大 ,所 以 不 得 不 在 满足 整体 的 基本 需求 和 保证 特殊 的 
孩子 (差异 连续 体 的 两 端 ) 得 到 他 们 需要 的 机 会 之 间 寻 求 平 衡 。 阅 读 显 然 
是 教育 过 程 中 重要 的 部 分 ,阿拉 巴 马 大 学 的 三 位 教授 研究 阅读 资料 和 常规 
教学 对 有 学 习 障 碍 的 孩子 的 阅读 能 力 的 影响 。 雷 尼 塔 . 古 德 曼 .加 里 . 萨 
普 与 安 : 舒 梅 特 : 福 斯 特 ( Renitta Goldman ,Gary L. Sapp,& Ann Shumate 
Foster) 发 现 , 大 体 上 来 说 ,对 阅读 资料 和 课堂 教学 给 予 一 年 的 日 常 指导 在 
阅读 成 绩 提 高 方面 没有 差异 。 通 过 对 阅读 资料 这 一 组 前 测试 和 后 测试 的 
特定 比较 ,他 们 发 现 ty =1.23,p>.05。 在 项 目的 最 初 ,阅读 资料 组 的 孩子 
的 阅读 成 绩 是 85. 5。 在 项 目的 最 后 阅读 资料 组 的 孩子 的 阅读 成 绩 是 
88. 5 一 一 有 差异 ,但 是 差异 不 显著 。 

为 什么 用 非 独立 均值 检验 ? 非 独立 均值 检验 表明 是 相同 的 群体 在 两 
种 不 同 的 条 件 下 进行 相同 的 研究 。 在 这 个 案例 中 ,条 件 是 实验 前 和 实验 结 
束 后 。 首 要 的 原因 是 相同 的 孩子 测试 两 次 ,也 就 是 在 1 年 期 项 目 开始 之 前 
和 1 年 期 项 目 结束 之 后 ,所 以 我 们 使 用 非 独 立 均值 检验 。 依 据 上 面 的 结果 
你 可 以 知道 ,在 项 目前 和 项 目 后 阅读 成 绩 没 有 差异 。: 值 (1. 23 ) 非常 小 ， 
没有 落 在 我 们 拒绝 零 假 设 的 值 域 范 围 之 外 。 换 名 话说 ,变化 太 小 ,我 们 不 
能 说 变化 是 由 随机 因素 之 外 的 因素 引起 。 这 么 小 的 差异 一 一 2.7(88.5 – 
85.8) 可 能 是 由 于 抽样 误差 或 者 组 内 的 变化 引起 。 

是 否 想 了 解 更 多 ? 查阅 古 德 曼 、 萨 普 和 福 斯 特 ( Со1йтап, r. , Sapp, 
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жаза, ен 

c.l. ,& Foster,a. в. )1998 年 发 表 在 《感知 与 运动 技能 》( Perceptual and Mo- 
tor Skills)86 期 192 ~ 194 页 上 的 文章 “学 习 障 碍 学 生 在 阅读 资料 和 常规 课 
演 教 学 中 阅读 能 力 的 提高 (Reading achievement by learning disabled student 


іп resource апа regular classes ) ”。 
知识 和 智 识 路 径 


下 面 介 绍 如 何 使 用 流程 表 选 择 合适 的 统计 检验 ,也 就 是 非 独 立 均 值 的 
t 检验。 沿 着 图 10. 1 中 加 黑 的 步骤 就 可 以 。 








1 一 学 生 的 项 目前 测试 和 项 目 后 测试 成 绩 的 差异 是 关注 的 重点 。 
2 一 每 一 个 参与 者 接受 不 止 一 次 的 测试 。 

3 一 有 两 个 群体 。 

4 一 合适 的 统计 检验 方法 是 非 独立 均值 的 上 检验 。 





计算 检验 统计 量 


非 独立 均值 上 检验 包含 每 一 群体 均值 的 比较 ,而 且 重 点 是 不 同 数值 之 
间 的 差异 。 就 如 公式 10.1 所 示 ,两 次 测试 的 差异 总 和 构成 分 子 , 表 示 群 体 
之 间 的 差异 。 
йерн pe Жала) ж 
зур - [> D) 
эе чө, ы; 
其 中 
У D 表示 群体 间 差 异 的 总 和 
У D 表示 群体 间 差 异 的 平方 和 
n 表示 成 对 观察 的 参与 者 数量 
下 面 用 一 些 数据 说 明 t 值 如 何 计 算 。 就 如 上 面 给 出 的 例子 一 样 列 出 
前 测试 和 后 测试 结果 ,而 且 为 了 解释 的 需要 假定 这 是 阅读 项 目前 和 后 的 
成 绩 。 
下 面 是 著名 的 八 个 步骤 和 4 检验 统计 量 的 计算 。 
1. 零 假设 和 研究 假设 的 表述 。 零 假设 表示 前 测试 和 后 测试 的 阅读 成 
绩 均 值 之 间 没 有 差异 。 研 究 假设 是 单 人 出 有 方向 的 假设 ,因为 研究 假设 假 
定 后 测试 成 绩 高 于 前 测试 成 绩 。 
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ГОТ 图 











ЖЕР 

前 测试 后 测试 差异 р? 

3 7 4 16 

5 8 3 9 

4 6 2 4 

6 7 1 1 

5 8 3 9 

5 9 4 16 

4 6 2 1 

2 6 1 1 

3 7 4 16 

6 8 2 4 

7 8 1 1 

8 7 -1 1 

7 9 2 4 

6 10 а 16 

7 9 2 4 

8 9 1 1 

8 8 0 0 

9 8 -1 1 

9 + -5 25 

8 4 -4 16 

7 5 -2 а 

7 6 -1 1 

6 9 3 9 

7 8 1 1 

8 12 4 16 
总 和 158 188 30 180 
EJ 6.32 7.52 1.4 7,2 

零 假 设 是 
H, ° Ml posttest = „ЖИЕ ( 10. 2) 
研究 假设 是 
Boss, > X u (10.3) 


2. 设置 零 假 设 的 风险 水 平 ( 或 显著 性 水 平 ,或 第 一 类 错误 ) 。 风 险 水 
平 或 第 一 类 错误 或 显著 水 平 是 . 05 ,这 完全 由 研究 者 决定 。 

З. 选择 合 适 的 检验 统计 量 。 使 用 图 10. 1 所 示 的 流程 表 , 我 们 确定 合 
适 的 检验 方法 是 非 独立 均值 的 1 检验 。 因 为 这 两 个 群体 相互 不 独立 ,所 以 
不 是 独立 均值 的 1 检验。 实际 上 ,这 两 个 群体 不 是 参与 者 群体 而 是 相同 参 
与 者 的 两 组 成 绩 。 两 组 之 间 相 互 依赖 。 非 独立 均值 :检验 的 另 一 个 名 称 
是 配对 样本 的 上 检验 ,或 相关 样本 的 上 检验 。 你 会 在 第 13 章 看 到 两 组 成 绩 
(前 测 和 后 测 ) 之 间 相 关 关 系 的 显著 性 检验 和 我 们 这 里 计算 的 i 值 之 间 有 
很 大 关系 。 

4. 计算 检验 统计 值 (也 叫做 实际 值 )。 现 在 我 们 代入 观察 值 并 进行 计 
算 。 上 面 已 经 给 出 i 值 计算 公式 。 代 入 具体 的 值 之 后 ,我 们 就 得 到 等 式 
10.4( 我 们 已 经 计算 了 前 测 和 后 测 成 绩 的 均值 和 标准 差 ) 。 
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EE НЕРВЕН (10. 4) 


(25 x 180) – 30? 
6—1 
代入 具体 的 数值 之 后 ,我 们 得 到 下 面 的 等 式 和 最 终 的 实际 1 值 2.45。 项 目 
前 测试 成 绩 的 均值 是 6. 32 ,项 目 后 测试 成 绩 的 均值 是 7.52。 
30 
150 


5. 使 用 特定 统计 量 的 临界 值 分 布 表 确定 拒绝 零 假设 需要 的 值 。 现 在 
我 们 需要 查阅 附录 B 的 表 B2 , 表 B2 列 出 了 i 检验 的 临界 值 。 我 们 又 一 次 
进行 了 i 检验 ,而 且 应 用 第 9 章 中 用 到 的 相同 的 临界 值 表 来 确定 拒绝 零 假 
设 的 临界 值 。 

我 们 的 第 一 个 任务 是 确定 自由 度 (df) ,自由 度 近似 于 样本 规模 。 对 现 
在 选 定 的 检验 统计 量 来 说 ,自由 度 是 m-1, 其 中 对 等 于 成 对 观察 的 参与 者 
数量 ,也 就 是 25 -1 =24。 这 项 统计 检验 的 自由 度 是 独特 的 ,对 其 他 统计 
检验 来 说 并 不 需要 。 

使 用 这 个 数字 (24) 你 愿意 承担 的 风险 水 平 ( 之 前 定义 的 .05 ) 以 及 单 
侧 检验 (因为 研究 假设 有 方向 后 测 成 绩 大 于 前 测 成 绩 ) ,拒绝 零 假 设 
需要 的 值 是 1.711。 

6. 比较 实际 值 和 临界 值 。 实 际 值 是 2. 45 ,大 于 拒绝 零 假 设 值 需要 的 
临界 值 。 

7. 和 8. 做 出 决定 。 现 在 我 们 该 做 出 决定 了 。 如 果实 际 值 大 于 临界 值 
就 不 能 接受 零 假设 。 如 果实 际 值 没有 超过 临界 值 , 零 假设 就 是 最 有 力 的 解 
释 。 在 这 个 案例 中 ,实际 值 超过 临界 值 一 一 这 个 值 足够 大 ,我 们 可 以 说 前 
测 成 绩 和 后 测 成 绩 的 差异 的 确 是 由 于 随机 因素 之 外 的 因素 引起 的 。 如 果 
我 们 的 实验 安排 正确 ,那么 是 什么 因素 影响 结果 ? 很 简单 一 一 是 日 常 阅读 
项 目的 引入 。 我 们 知道 差异 的 产生 是 由 于 特定 的 因素 。 前 测 群体 和 后 测 
群体 之 间 的 差异 不 可 能 是 由 随机 因素 引起 的 ,而 是 由 于 特定 的 处 理 因 素 。 


那么 如 何 解释 ty) =2.45,p<.05 


es。 表示 我 们 所 用 的 检验 统计 量 。 

• 24 是 自由 度数 值 。 

ө2.45 是 实际 值 ,是 使 用 本 章 之 前 给 出 的 公式 计算 所 得 的 值 。 

。p<.05( 实 际 上 是 这 个 简短 表达 式 中 最 重要 的 部 分 ) 表示 对 零 假设 
的 任何 检验 来 说 ,后 测 成 绩 的 均值 大 于 前 测 成 绩 的 均值 是 由 于 随机 因素 的 
可 能 性 小 于 5% ,也 就 是 说 有 其 他 因素 在 发 挥 作用 。 因 为 我 们 以 .05 作为 
研究 假设 比 零 假 设 更 有 解释 力 的 标准 ,我 们 的 结论 就 是 两 组 成 绩 之 间 具 有 
显著 性 差异 。 也 就 是 其 他 因素 在 发 挥 作 用 。 


t = = 2.45 (10.5) 





使 用 计算 机 进行 ;检验 


应 用 SPSS 可 以 随时 帮助 你 进行 推论 检验 。 现 在 就 运行 我 们 已 
经 完成 的 检验 并 对 结果 进行 解释 。 我 们 使 用 的 数据 集 名 称 是 第 10 
章 数据 集 1( chapter10 data set 1) ,这 个 数据 集 也 用 在 之 前 的 案例 中 。 

1. 在 数据 编辑 栏 录入 数据 。 要 确保 前 测 成 绩 和 后 测 成 绩 在 不 
同 的 列 。 与 独立 均值 : 检验 不 同 ,这 里 不 需要 定义 组 。 在 图 10.2 
中 你 可 以 看 到 每 一 列 的 开头 分 别 被 贴 上 标签 pretest 与 posttest。 








10.2 第 10 章 数 据 集 1 的 数据 
2. 点 击 Апаіуге->Сотраге Means 一 Pared-Samples T test , 你 就 会 
看 到 如 图 10.3 所 示 的 对 话 框 。 


\ Paired-Samples 


图 10.3 配对 样本 1 检验 对 话 框 
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3. 按 住 Shift 键 ,然后 点 击 变 量 pretest 与 posttest。 

4. 点 击 呈 将 选中 的 变量 移 到 Pared Variables 框 中 。 

5. 点 击 OK。 

6. 接着 SPSS 执行 分 析 过 程 然后 得 出 图 10.4 所 示 的 结果 。 


SPSS 和 输出 结果 的 含义 


SPSS 的 输出 结果 很 明确 。 先 是 对 不 同 构成 的 描述 ,接着 关注 在 
本 书 范围 之 内 而 且 对 理解 我 们 正在 讨论 的 检验 非常 重要 的 内 容 。 

首先 ,对 于 前 测 和 后 测 成 绩 来 说 ,都 给 出 了 均值 .样本 规模 、 标 
准 差 和 均值 的 标准 误差 (对 抽样 误差 的 测量 ) 。 就 这 个 结果 来 说 ， 
你 可 以 直接 知道 后 测 成 绩 (7. 52) 大 于 前 测 成 绩 (6. 32 ) 。 进 一 步 分 
析 可 以 知道 这 个 结果 支持 研究 假设 ,也 就 是 学 生 的 后 测 成 绩 高 于 
前 测 成 绩 。 

现在 来 看 令 人 感 兴趣 的 结果 一 一 与 1 检验 相关 的 实际 值 。 前 
测 和 后 测 群体 之 间 的 均值 之 差 是 — 1.2, 因 为 是 前 测 成 绩 均值 减 去 
后 测 成 绩 均值 所 以 是 负 值 。 由 于 随机 因素 影响 使 (826 3 — 2. 449 
的 可 能 性 是 .022 一 一 所 以 几乎 不 可 能 的 。 但 是 我 们 还 不 能 得 出 支 
持 研究 假设 的 结论 。 继 续 往 下 看 。 

是 否 注意 到 我 们 这 里 的 结果 和 应 用 公式 10.5 手动 计算 并 进 
行 分 析 结 果 之 间 的 任何 差异 ? SPSS 输出 结果 中 差异 是 负 值 (图 
10.4) 。 但 是 我 们 在 手动 计算 时 这 个 值 是 正 值 。 你 知道 为 什么 吗 ? 
因为 SPSS( 不 论 是 否 相信 ) 进行 均值 之 间 的 单 侧 检验 不 是 很 容易 ， 
而 且 总 是 用 第 一 个 变量 (在 这 个 案例 中 是 前 测 成 绩 ) 减 去 第 二 个 变 
量 ( 在 这 个 案例 中 是 后 测 成 绩 ) 。 而 我 们 手动 计算 时 ,我 们 以 相反 
的 方式 进行 ,与 研究 假设 一 致 ( 见 公 式 10.3). SPSS 只 是 不 支持 这 
种 类 型 的 分 析 。 那 么 我 们 该 怎么 做 ? 

现在 我 们 回 到 第 9 章 用 到 的 临界 值 表 , 并 且 如 果 结 果 是 显著 
的 我 们 就 进行 分 析 。 使 用 附录 B 表 B2 ,我 们 发 现 对 自由 度 24、 显 
著 水 平 . 05 的 单 侧 检验 来 说 ,拒绝 零 假设 的 临界 值 是 1. 711。 因 
此 ,虽然 SPSS 给 出 特定 的 : 值 , 但 是 没有 给 出 单 侧 检验 值 的 概率 水 
平 。SPSS 在 双 侧 检验 中 给 出 这 种 可 能 性 ,而 在 单 侧 检验 中 没有 给 
出 。 因 此 ,我 们 必须 依赖 自己 的 技能 来 近似 地 获得 这 个 值 ,就 如 我 
们 在 这 里 所 做 的 ,或 者 使 用 其 他 可 以 进行 单 侧 检验 的 软件 (在 18 
章 可 以 了 解 更 多 相关 的 内 容 ) 。 
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小 结 
这 是 对 均值 的 检验 。 你 已 经 知道 如 何 比 较 来 自 独立 群体 (第 9 章 ) 和 非 独立 
群体 (第 10 章 ) 的 数据 ,而 且 现在 是 时 候 更 进一步 学 习 处 理 两 个 以 上 群体 (可 能 
是 独立 的 也 可 能 是 非 独 立 的 ) 的 显著 性 检验 。 这 项 统计 技术 就 是 方差 分 析 , 这 项 
统计 分 析 工 具 非 常 重要 、 应 用 广泛 ,也 很 有 价值 。 


练习 时 间 

1. 独立 均值 检验 和 非 独 立 均值 检验 有 何不 同 ? 何 时 使 用 哪 一 个 ? 

2. 使 用 第 10 章 数据 集 2(chapter 10 data 2) 手 动 计 算 上 值 , 然 后 将 结论 写 下 
来 ,也 就 是 25 个 街区 的 回收 项 目 是 否 影 响 纸 的 使 用 量 。( 提 示 : 项 目前 和 项 目 后 
是 两 个 不 同 的 测试 水 平 。) 在 .01 显著 水 平 下 检验 零 假 设 。 

3. 使 用 第 10 章 数据 集 3(chapter 10 data 3 ) 计算 上 值 ,然后 将 结论 写 下 来 ,也 
就 是 引入 服务 项 目 之 后 使 用 服务 中 心 的 家 庭 的 满意 水 平 是 否 有 差异 。 使 用 SPSS 
完成 这 个 练习 ,并 且 给 出 结果 的 准确 的 可 能 性 。 


练习 参考 答案 

1. 独立 均值 上 检验 用 于 检验 两 个 不 同 的 参与 者 群体 ,每 个 群体 接受 一 次 测 
试 。 非 独立 均值 上 检验 用 于 一 个 参与 者 群体 ,其 中 每 一 个 参与 者 接受 两 次 测试 。 

2. 在 回收 项 目 执行 之 前 的 均值 是 34.44 ,项 目 执行 之 后 的 均值 是 34.84。 回 
收 有 所 增长 。 这 25 个 街区 的 差异 是 否 是 显著 的 ? 实际 上 值 是 .262, 自 由 度 是 24， 
在 .01 的 显著 水 平 下 一 一 我 们 假设 在 这 个 显著 水 平 研究 假设 接受 检验 ,是 不 显著 
的 。 结 论 是 :回收 项 目 没有 影响 纸 的 循环 使 用 量 的 增长 。 

3. 满意 水 平 有 所 增长 ,从 5.48 增长 到 7.60, 相 应 的 上 值 是 -3.893。 相 应 的 
差异 的 概率 水 平 是 .001。 也 就 是 社会 服务 项 目 在 发 挥 作用 。 


融 个 群体 是 否 太 多 ? 
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本 章 你 会 学 到 什么 | 


e 方差 分 析 是 什么 , 何 时 使 用 
o 如 何 计算 和 解释 F ФЕ 
ө 如 何 使 用 SPSS 完成 方差 分 析 





方差 分 析 介 绍 


心理 学 的 一 个 新 兴 领 域 是 体育 心理 学 。 虽 然 这 个 领域 主要 关注 提高 运 
动 成 绩 ,但 也 关注 运动 的 许多 其 他 方面 。 其 中 之 一 是 什么 心理 技能 对 于 成 
为 一 个 成 功 的 运动 员 是 必需 的 。 带 着 这 个 问题 ,马里 斯 . 古 塔 , 杨 尼斯 . ЗЕ 
奥 佐 拉 基 斯 和 乔治 斯 . 卡拉 莫 萨 利 蒂 斯 (Marious Goudas , Yiannis Theodorakis , 
& Georgios Karamousalidis ) 对 运动 员 应 对 技能 量 表 的 有 效 性 进行 了 检验 。 

作为 研究 的 一 部 分 ,他 们 使 用 简单 的 方差 分 析 ( 或 ANOVA ) 检验 假 
设 , 也 就 是 某 项 运动 的 训练 年 数 与 应 对 技能 (或 者 运动 员 应 对 技能 量 表 的 
得 分 ) 的 关系 。 因 为 需要 检验 两 个 以 上 的 群体 ,并 比较 这 些 群 体 的 平均 成 
绩 ,所 以 使 用 方差 分 析 。 具 体 地 说 ,群体 1 是 训练 年 数 在 6 年 之 内 的 运动 
А ,群体 2 是 训练 了 7 ~ 10 年 的 运动 员 ,群体 3 是 训练 年 数 在 10 年 以 上 的 
运动 员 。 | 

方差 分 析 的 检验 统计 量 是 下 值 (以 这 个 统计 量 的 建立 者 R. А. Fisher 
命名 ) ,结果 是 Ғоло -13.08,р<.01, = 4 E K ñ НЕ JJ КІ ЕНІ ТІН 
表 测 试 成 绩 的 均值 两 两 不 同 。 换 句 话说 测试 成 绩 的 任何 不 同 是 由 于 在 运 
动 方面 的 训练 年 数 的 不 同 ,而 不 是 可 能 影响 成 绩 的 随机 因素 。 

是 否 想 了 解 更 多 ? 查阅 原始 文献 : 古 塔 、 塞 奥 佐 拉 基 斯 和 卡拉 莫 萨 利 
蒂 斯 (Goudas М. , Theodorakis, Ү., ，& Karamousalidis , K. )1998 年 发 表 在 
《感知 和 运动 技能 》( Perceptual and Motor Skills)86 期 59 ~ 65 页 的 文章 “ 篮 
球 运动 中 的 心理 技能 :发 展 运动 员 应 对 技能 量 表 的 希腊 形式 的 初步 研究 
( Psychological skills in basketball: Preliminary study for development of a 
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Greek form of the Athletic Coping Skills Inventory ) o” 
知识 和 知识 路 径 


下 面 介绍 如 何 使 用 图 11. 1 所 示 流 程 表 选 择 方差 分 析 作为 合适 的 统计 
检验 方法 。 沿 着 图 中 加 黑 的 步骤 就 可 以 。 


1 一 我 们 检验 不 同 群 体 之 间 的 差异 ,在 这 个 案例 中 是 检验 运动 员 颅 
峰 成 绩 的 差异 。 

2 一 每 一 个 运动 员 只 接受 一 次 测试 。 

3 一 有 三 个 群体 ( 按 训练 年 数 分 为 6 年 以 下 .7 = 10 年 和 10 年 以 
上 )。 

4 一 合适 的 检验 统计 是 简单 方差 分 析 。 





方差 分 析 的 不 同类 型 


方差 分 析 有 许多 不 同 的 形式 。 最 简单 的 形式 是 简单 方差 分 析 (simple 
analysis of variance) ,也 是 本 章 的 重点 ,只 分 析 一 个 因素 或 者 一 个 处 理 变 量 
(如 群体 身份 ) ,而 有 两 个 以 上 的 群体 受到 这 个 因素 的 影响 。 简 单方 差分 
析 也 叫做 一 元 方差 分 析 (one-way analysis of variance ) ,因为 只 有 一 个 分 组 
维度 。 这 项 技术 叫做 方差 分 析 , 这 是 由 于 运动 成 绩 差异 产生 的 方差 可 以 分 
解 为 群体 内 个 体 差 异 产生 的 方差 和 群体 之 间 差 异 产生 的 方差 。 接 着 对 两 
类 方差 进行 相互 比较 。 

实际 上 ,方差 分 析 在 许多 情况 下 类 似 于 1 检验。 在 这 两 项 检验 中 都 需 
要 计算 均值 之 间 的 差异 。 但 方差 分 析 要 处 理 两 个 以 上 的 均值 。 

例如 ;我 们 调查 每 个 星期 呆 在 预备 学 校 5,10 和 20 个 小 时 对 语言 发 展 
的 影响 。 每 个 孩子 所 属 的 组 别 就 是 处 理 变 量 ,或 者 就 是 分 组 因素 。 语 言 发 
展 是 被 解释 变量 或 者 是 结果 。 实 验 设 计 类 似 如 下 所 示 。 


组 工 每 星期 5 小时) 组 2( 每 星期 10 小 时 ) 组 3( 每 星期 20 小 时 ) 
语言 发 展 测试 成 绩 语言 发 展 测试 成 绩 语言 发 展 测试 成 绩 


更 复杂 的 方差 分 析 类 型 是 析 因 设计 (factorial design) ,是 分 析 一 个 以 
上 的 处 理 变量 。 下 面 的 案例 是 研究 参加 预备 学 校 的 时 间 所 产生 的 效应 ,但 
是 性 别 差 异 产 生 的 效应 也 是 研究 的 内 容 。 实 验 设 计 类 似 如 下 所 示 : 
参加 预备 学 校 的 时 间 
性 别 。 组 1( 每 星期 5 小 时 ) 组 2( 每 星期 10 小 时 ) 组 3( 每 星期 20 小 时 ) 
男 语言 发 展 测试 成 绩 。 “语言 发 展 测试 成 绩 。 “语言 发 展 测试 成 绩 
Ж 语言 发 展 测试 成 绩 ”语言 发 展 测试 成 绩 。 ”语言 发 展 测试 成 绩 
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这 是 3 x2 的 析 因 设计 。3 表示 分 组 因素 有 三 个 层级 (组 1, 组 2 和 组 
3). 2 表示 其 他 分 组 因素 有 两 个 层级 ( 男 和 女 )。 综 合 起 来 就 有 6 种 不 同 
的 可 能 性 (每 个 星期 果 在 预备 学 校 5 小 时 的 男生 ,每 个 星期 呆 在 预备 学 校 
5 小 时 的 女生 ;每 个 星期 呆 在 预备 学 校 10 小 时 的 男生 ,等 等 ) 。 

析 因 设计 遵循 和 简单 方差 分 析 一 样 的 基本 逻辑 和 原则 ,但 是 析 因 设计 
更 为 复杂 ,需要 同时 检验 一 个 以 上 的 因素 的 影响 以 及 因素 综合 的 影响 。 不 
用 担心 一 一 接 下 来 的 一 章 会 全 面 学 习 析 因 设 计 。 


计算 检验 统计 量 


简单 方差 分 析 检 验 两 个 以 上 的 群体 在 一 个 因素 或 一 个 维度 上 的 均值 
差异 。 例 如 ,你 可 能 想 知道 四 个 群体 (20,25 ,30 和 35 岁 的 年 龄 群体 ) 对 私 
人 学 校 的 公共 财政 支持 的 态度 。 或 者 你 想 知 道 5 个 不 同年 级 (2,4,6,8 和 
10 年 级 ) 的 学 生 群 体 的 父母 参与 学 校 活 动 的 水 平 是 否 有 差异 。 

任何 分 析 如 果 

° 只 有 一 个 维度 或 者 一 个 处 理 变量 ， 

° 分 组 因素 有 两 个 以 上 的 层级 ,而 且 

。 关注 不 同 群 体 在 平均 成 绩 上 的 差异 
就 需要 使 用 简单 方差 分 析 。 

F 值 是 检验 假设 也 就 是 群体 之 间 有 差异 的 检验 统计 量 , 计 算 公 式 如 公 
式 11.1 所 示 。 就 方差 分 析 而 言 这 是 简单 的 公式 ,但 是 相对 于 前 几 章 学 习 
的 其 他 检验 统计 量 来 说 需要 花费 更 多 精力 来 计算 。 
М5... 
MS in 








Е = (11.1) 





如 此 。 方 差分 析 公 式 (是 一 个 比率 ) 比较 组 间 的 变化 量 ( 由 于 分 组 
因素 产生 ) 与 组 内 的 变化 量 ( 由 于 随机 因素 产生 ) 。 如 果 比 值 为 1， 
那么 组 内 差异 产生 的 变化 量 等 于 组 间 差 异 产生 的 变化 量 , 而且 组 
闻 的 任何 差异 都 不 显著 。 如 果 组 间 差 异 的 平均 值 变 大 (也 就 是 比 
率 的 分 子 变 大 ) ,F 值 也 变 大 。 如 果 Е 值 变 大 ,在 所 有 的 下 值 分 布 
中 就 会 更 趋向 于 极 值 ,也 就 是 更 可 能 由 于 随机 因素 之 外 的 因素 
影响 。 


这 个 比率 背后 的 逻辑 就 是 这 样 。 如 果 组 内 完全 没有 变化 (所 
:> 有 的 成 绩 都 相同 ) ,那么 组 之 间 的 任何 差异 都 有 意义 ,对 吧 ? 可 能 





下 面 给 出 一 些 数据 并 初步 的 计算 来 说 明正 值 如 何 计算 。 就 我 们 的 例 
子 来 说 ,我 们 假定 这 是 三 个 预备 学 校 参与 者 群体 和 他 们 的 语言 测试 成 绩 。 


18 22%%% 史上 统计 学 


群体 1 的 成 绩 群体 2 的 成 绩 群体 3 的 成 绩 
87 87 77779 
86 85 91 
76 99 96 
56 85 87 
78 79 89. 
298 81 90 
77 82 89 
66 78 96 


75 85 96 
67 91 93 





下 面 是 著名 的 八 个 步骤 和 下 检验 统计 量 的 计算 。 

1. 零 假设 和 研究 假设 的 表述 。 公 式 11.2 所 示 的 零 假设 表示 三 个 不 同 
群体 的 均值 之 间 没 有 差异 。 方 差分 析 , 也 叫做 下 检验 (因为 计算 得 出 的 是 
正统 计量 或 下 比值 ) ,寻求 不 同 群体 之 间 所 有 的 差异 。 

检验 不 是 分 析 配 对 差异 ,如 群体 1 和 群体 2 之 间 的 差异 。 我 们 需要 
使 用 另 一 项 统计 技术 进行 配对 差异 分 析 ,本 章 后 面部 分 会 讨论 


Н: ш. = џи, = и, (11.20 


公式 11.3 所 示 的 研究 假设 表示 三 个 群体 的 均值 之 间 相 互 有 差异 。 要 注意 
的 是 所 有 的 差异 之 间 没 有 方向 ,这 是 因为 所 有 的 F 值 都 是 无 方向 的 。 


Н,: X, ж Х, + Х, (11.35 


| 
“ z 





2. 设置 零 假 设 的 风险 水 平 (或 显著 性 水 平 , 或 第 一 类 错误 ) 。 风 险 水 
平 或 第 一 类 错误 或 显著 水 平 ( 或 者 其 他 名 称 ?) 是 . 05。 再 一 次 申明 ,风险 
水 平 完 全 由 研究 者 决定 。 

3. 选择 合适 的 检验 统计 量 。 使 用 图 11. 1 所 示 的 流程 表 , 我 们 确定 合 
适 的 检验 方法 是 简单 方差 分 析 。 
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даа, ipa 
4. 计算 检验 统计 值 (也 叫做 实际 值 ) 。 
现在 我 们 代入 具体 的 值 并 进行 计算 。 需 要 进行 很 多 计算 。 
se 下 值 是 组 间 差 异 和 组 内 差异 的 比值 。 要 计算 这 些 值 ,首先 我 们 要 计 
算 每 一 种 差异 一 一 组 间 .组 内 和 总 的 差异 的 平方 和 。 
。 组 间 差 异 平 方 和 等 于 对 所 有 值 的 均值 和 每 一 个 群体 的 均值 之 差 平 
方 然后 求 和 。 这 意味 着 每 一 群体 的 均值 和 总 的 均值 的 差异 的 大 小 。 
e° 组 内 差异 平方 和 等 于 对 群体 内 每 一 个 具体 的 值 和 这 个 群体 的 均值 
之 间 的 差异 平方 然后 求 和 。 这 意味 着 群体 内 每 一 个 值 和 这 个 群体 
的 均值 的 差异 的 大 小 。 
e 总 的 差异 平方 和 等 于 组 间 差 异 平方 和 与 组 内 差异 平方 和 的 总 和 。 
现在 我 们 计算 这 些 值 。 
依据 上 面 给 出 的 实际 数值 计算 所 有 需要 计算 的 组 间 、 组 内 和 总 的 平方 和 。 
首先 ,我 们 看 看 这 个 扩展 的 表 中 所 有 的 项 目 , 先 从 这 个 表 的 左下 角 开 始 : 
n 表示 每 个 群体 的 参与 者 数量 (如 10) 
2, 半 表 示 每 个 群体 的 具体 数值 的 总 和 (如 766) 
表示 每 个 群体 的 均值 ( 如 76. 60) 


> (X°) 表示 每 个 数值 的 平方 和 (如 59 964) 


(х) 名 表示 每 个 群体 的 所 有 数值 的 和 的 平方 除 以 群体 的 规模 
( 4158 675.60) 


其 次 ,我 们 看 看 表 的 右 下 角 的 项 目 
М 表示 参与 者 的 总 体 数量 (如 30) 


> > 表示 所 有 群体 的 数值 的 总 和 
(> Хх) AN 表示 所 有 数值 的 总 和 的 平方 除 以 N 
> > (х) 表示 所 有 数值 的 平方 的 总 和 


> (Ух) 表示 每 个 群体 和 的 平方 的 总 和 除 以 n 


以 上 是 所 有 需要 进行 的 计算 ,我 们 也 几乎 完成 了 计算 。 
首先 我 们 计算 所 有 不 同 来 源 的 差异 的 平方 和 ,也 就 是 进行 这 样 的 
计算 : 


组 间 平 方 和 
> ( Ух) уп Z [> X x) /N 或 者 215 171. 60 - 214 038. 53 = 1 133.07 
组 内 平方 和 


(х) жеу (У.х) ип, 3# 216 910 — 215 171.6 = 1 738. 40 
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总 平方 和 
УУ (х) - (х Ух) /AN 或 者 216 910 - 214 038. 53 = 2871.47 


其 次 ,我 们 需要 计算 平方 和 的 均值 ,也 就 是 简单 的 平方 和 的 平均 值 。 
这 些 都 是 最 终 计算 比率 需要 的 方差 估计 。 

我 们 是 以 近似 的 自由 度 (4d/) 去 除 每 一 个 平方 和 。 还 记得 吗 ? 自由 度 
是 样本 规模 或 者 群体 规模 的 近似 值 。 对 方差 分 析 来 说 我 们 需要 两 类 自由 
度 。 对 组 间 估 计 来 说 ,自由 度 是 上 - 1, 其 中 大 等 于 群体 的 数量 (在 这 个 案例 
中 ,有 3 个 群体 ,自由 度 是 2) ,对 组 内 估计 来 说 ,我 们 需要 的 自由 度 是 NN — 
k HEP N 是 总 的 样本 规模 (也 就 是 说 自由 度 是 30 -3, 或 27)。 而 且 F 比 
率 是 组 间 差 异 平方 和 均值 与 组 内 差异 平方 和 均值 的 简单 比值 ,或 566. 54/ 
64.39 =8.799。 这 就 是 实际 的 下 值 。 

下 面 的 表格 总 结 了 用 于 计算 F 比率 的 方差 估计 ,也 是 专业 期 刊 和 手 


稿 中 大 多 数 正 表 出 现 的 形式 。 
来 源 ”平方 和 df 平方 和 的 均值 ( 均 方 ) Е 
组 间 1133.07 2 566. 54 8.799 
组 内 1738.40 27 64.39 


总 和 ”2 871.47 29 





要 计算 一 个 小 小 的 值 确实 挺 麻 烦 啊 ! 但 是 我 们 之 前 已 经 说 过 ,至 
少 手 动 计算 一 次 对 了 解 计算 过 程 很 重要 。 计 算 过 程 会 告诉 你 这 些 数 字 的 
来 源 , 而 且 一 定 程度 上 可 以 更 好 地 了 解 这 些 数字 的 含义 。 


ҳу 





5. 使 用 特定 统计 量 的 临界 值 分 布 表 确 定 拒绝 零 假 设 需要 的 值 。 就 如 
之 前 所 进行 的 ,我 们 需要 比较 实际 值 和 临界 值 。 我 们 现在 需要 查阅 附录 B 
表 B3 ,也 就 是 下 检验 的 临界 值 分 布 表 。 我 们 的 第 一 个 任务 是 确定 分 子 的 
自由 度 ,也 就 是 上 -1, 或 3 -1=2。 接 着 确定 分 母 的 自由 度 ,也 就 是 N — k, 
或 30 -3 =27。 结合 在 一 起 可 以 表示 为 Famo | 

实际 值 是 8. 80 ,或 Fon =8.80。 在 显著 水 平 为 .05、 分 子 自 由 度 为 2 
(HÆ Вз 中 的 纵 行 表示 )、 分 母 自 由 度 为 27( 由 表 ВЗ 中 的 横行 表示 ) 情况 
下 临界 值 是 3.36。 也 就 是 在 显著 水 平 为 .05 Á H EER 2 和 27 的 三 个 群体 
的 均值 的 综合 检验 来 说 ,拒绝 零 假 设 所 需要 的 值 是 3.36。 

6. 比较 实际 值 和 临界 值 。 实 际 值 是 8. 80 ,在 .05 显著 水 平 下 拒绝 零 假 设 也 
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就 是 说 三 个 群体 相互 有 差异 (没有 关注 差异 在 什么 地 方 ) 的 临界 值 是 3.36。 

7. 和 8. 做 出 决定 。 现 在 我 们 该 做 出 决定 了 。 如 果实 际 值 大 于 临界 值 
就 不 能 接受 零 假设 。 如 果实 际 值 没有 超过 临界 值 , 零 假设 就 是 最 有 力 的 解 
释 。 在 这 个 案例 中 ,实际 值 超过 临界 值 一 一 这 个 值 足 够 大 ,我 们 可 以 说 三 
个 群体 之 间 的 两 两 差异 不 是 由 于 随机 因素 引起 的 。 如 果 我 们 的 实验 过 程 
正确 ,那么 是 什么 因素 影响 结果 ? 很 简单 一 一 是 在 预备 学 校 的 时 间 。 我 们 
知道 差异 的 产生 是 由 于 特定 的 因素 ,因为 群体 之 间 的 差异 不 可 能 是 由 随机 
因素 引起 的 ,而 是 由 于 特定 的 处 理 变 量 。 


那么 如 何 解释 F ,=8. 80,p<.05 


° F 表示 我 们 使 用 的 检验 统计 量 。 

92,27 是 组 间 估 计 和 组 内 估计 的 自由 度数 值 。 

° 8.80 是 实际 值 ,是 使 用 本 章 之 前 给 出 的 公式 计算 所 得 的 值 。 

ep <.05( 实 际 上 是 这 个 简短 表达 式 中 最 重要 的 部 分 ) 表示 对 零 假 设 
的 任何 检验 来 说 ,每 个 群体 语言 技能 的 平均 成 绩 相互 不 同 的 原因 是 由 于 随 
机 因素 而 不 是 实验 变量 的 影响 造成 的 可 能 性 小 于 5% 。 因 为 我 们 以 .05 作 
为 研究 假设 比 零 假设 更 有 解释 力 的 标准 ,我 们 的 结论 就 是 三 个 群体 之 间 存 
在 显著 差异 。 


6 想象 这 样 的 事件 。 你 是 广告 公司 的 有 高 级 授权 的 研究 者 , 想 
RN 知道 颜色 是 否 影响 销售 。 而 且 你 在 . 05 的 显著 水 平 下 进行 检验 。 
б)» 你 将 全 黑 , 全 白 ,25% 带 彩色 ,50% 带 彩色 和 100% 是 彩色 的 产品 集 
合 在 一 起 构成 5 个 不 同 的 层级 。 然 后 进行 方差 分 析 并 发 现 有 差异 
存在 。 但 是 方差 分 析 是 综合 的 检验 ,你 不 知道 显著 差异 的 来 源 。 
因此 你 一 次 只 能 选择 两 个 群体 (如 25% 带 彩色 和 75% 带 彩色 ) 然 
后 进行 相互 检验 。 实 际 上 你 要 检验 每 一 个 两 两 群体 组 合 的 差异 。 
这 样 做 对 吗 ? 不 对 。 这 被 称 为 多 元 : 检验 ,而 多 元 :检验 实际 上 违 
反 一 些 原则 。 当 进行 多 元 : 检验 时 ,由 于 要 执行 的 检验 的 数量 增 
加 ,第 一 类 错误 ( 你 设 定 为 .05) 发 生 的 可 能 性 提高 。 这 项 检验 中 有 
10 对 可 能 的 群体 差异 比较 (如 没 带 彩色 与 25% 带 彩色 , 没 带 彩色 
与 50% 带 彩色 , 没 带 彩色 与 75% 带 彩色 等 ) ,第 一 类 错误 真正 发 生 
的 可 能 性 是 1 - (1 -a) ,其 中 
a 表示 第 一 类 错误 发 生 的 水 平 ,在 这 个 案例 中 是 . 05 
k 表示 比较 的 数量 
因此 每 一 对 比较 群体 被 检验 时 实际 的 第 一 类 错误 不 是 .05 ,而 
是 .40( 原 书 为 .22) ,或 者 
1 -(1-.05)% -.40(!!!!!) 


肯定 不 是 .05。 差 异 很 大 ,不 是 吗 ? 
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使 用 计算 机 计算 下 比率 


F 比率 不 容易 手动 计算 。 需 要 太 多 的 计算 才能 得 出 F 比率 。 
©. 使 用 计算 机 会 更 容易 、 更 准确 ,因为 计算 机 可 以 消除 计算 上 的 误 
差 。 也 就 是 说 你 会 为 手动 计算 了 这 个 值 而 感到 高 兴 , 因为 这 是 一 

项 你 应 该 掌握 的 技能 。 可 也 会 同样 高 兴 可 以 使 用 类 似 SPSS 的 工 
具 来 计算 。 

我 们 使 用 第 11 章 数 据 集 1(chapter 11 data sèt 1) 中 的 数据 ,也 
就 是 之 前 预备 学 校 案 例 中 使 用 的 数据 。 

1. 在 数据 编辑 栏 录 人 数据 。 要 确保 群体 在 同一 列 ,这 一 列 中 
有 三 个 不 同 的 群体 。 在 图 11.3 你 可 以 看 到 每 一 列 开 始 的 标签 分 
别 为 group 与 lang_sc。 








图 11.3 第 11 章 数据 集 1 数据 

2. 点 击 Analyze 一 Compare Means 一 One-Way 方差 分 析 ,你 就 会 
看 如 图 11.4 所 示 的 一 元 方差 分 析 对 话 框 。 

3. 点 击 变量 group ,然后 点 击 P> 将 选中 的 变量 移 到 Factor 框 中 。 

4. 点 击 变 量 lang_sc, 然 后 点 击 P> 将 选中 的 变量 移 到 Depend 
List 框 中 。 

5. 点 击 Opertions ,接着 点 击 Descriptives ,然后 点 击 Continue。 

6. 点 击 OK。SPSS 执行 分 析 过 程 然后 得 出 图 11.5 所 示 的 结果 。 
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Ш 11.4 一 元 方差 分 析 对 话 框 
SPSS 输出 结果 的 含义 


SPSS 的 输出 结果 很 明确 ,而 且 和 之 前 我 们 展示 如 何 计算 比率 而 
建立 的 表 类 似 ,同时 给 出 了 描述 统计 量 。 下 面 就 是 我 们 得 到 的 内 容 。 

1. 我 们 确定 的 方差 来 源 一 一 组 间 、 组 内 和 总 的 方差 。 

2. 接着 是 我 们 需要 的 不 同 来 源 的 差异 平方 和 。 

3. 然后 是 自由 度 , 以 及 平方 和 均值 (或 均 方 ) ,也 就 是 平方 和 除 
以 自由 度 。 

4. 最 后 ,就 是 实际 值 和 相应 的 显著 水 平 。 

要 记 住 的 一 点 是 假设 是 在 .05 的 显著 水 平 检验 。SPSS 的 输出 
结果 给 出 了 结果 的 准确 的 概率 水 平 ,. 001 一 一 比 . 05 更 为 准确 ,而 
且 更 不 可 能 。 





现在 你 已 经 运行 了 方差 分 析 分 析 , 也 知道 三 个 、 四 个 或 者 更 多 
群体 之 间 有 差异 。 但 是 差异 处 在 什么 位 置 ? 你 已 经 知道 不 能 进行 
多 元 上 检验 ,就 需要 进行 事后 ( post hoc ) 比较 检验 或 既成 事实 (af- 
ter-the-fact) 分析 。 也 就 是 每 一 个 群体 的 均值 和 另 一 个 群体 的 均值 
比较 ,然后 来 看 差异 处 在 什么 位 置 ,但 是 最 重要 的 是 每 一 次 比较 的 
第 一 类 错误 都 控制 在 你 设 定 的 相同 的 水 平 。 其 中 要 进行 许多 不 同 
的 比较 ,也 就 是 Bonferroni( 作 者 偏好 使 用 的 统计 学 词汇 ) 分 析 。 使 
用 SPSS 完成 特定 的 分 析 之 后 ,在 方差 分 析 对 话 框 ( 图 11.4) 你 可 以 
看 到 Post Нос 选项 ,选中 这 个 选项 之 后 点 击 Bonferroni , 接着 点 击 
Continue ,然后 你 就 看 到 如 图 11. 6 所 示 的 SPSS 输出 结果 。 你 可 以 
很 容易 就 看 到 这 些 分 析 告 诉 你 引起 三 个 群体 之 间 整 体 的 显著 性 差 
异 的 群体 配对 显著 性 差异 处 在 群体 1 和 群体 3 之 间 , 而 且 和 群体 1 和 
群体 2 或 群体 2 和 群体 3 之 间 没 有 配对 差异 。 配 对 分 析 非 常 重要 ， 
可 以 让 你 知道 两 个 以 上 群体 差异 的 来 源 。 
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созе 
| 小 结 

方差 分 析 ( 方 差分 析 ) 是 《 爱 上 统计 学 》 这 本 书 中 你 能 学 到 的 最 复杂 的 推论 
检验 。 你 需要 付出 更 多 的 精力 来 进行 手动 计算 ,即使 可 以 使 用 SPSS ,你 也 必须 真 
的 了 解 这 是 综合 的 检验 ,而 且 只 做 部 分 的 话 不 能 给 出 配对 群体 差异 的 信息 。 只 
有 紧 接 着 进行 事后 分 析 , 你 才 真 正 完 成 与 这 项 有 力 的 工具 相关 的 所 有 的 工作 。 
如 果 是 均值 之 间 不 止 一 次 的 检验 ,那么 就 是 析 因 方差 分 析 。 还 有 Holy Grail 方差 
分 析 , 可 以 分 析 两 个 或 更 多 因素 ,但 是 我 们 主要 讨论 两 个 因素 的 方差 分 析 , 而 且 
SPSS 会 展示 出 具体 的 方式 。 


练习 时 间 
1. 使 用 下 面 的 表 给 出 三 个 简单 一 元 方差 分 析 案 例 、 两 个 两 因素 方差 分 析 案 
例 和 一 个 三 因素 方差 分 析 案 例 。 我 们 给 出 一 些 案 例 , 比 照 我 们 所 做 的 确定 分 组 
变量 和 检验 变量 。 


分 组 变量 белен 


培训 时 间 分 为 四 个 层 
简单 方差 分 析 заяв 个 小 时 | 打字 的 准确 程度 


填 入 你 的 案例 填 人 你 的 案例 
填 人 你 的 案例 填 入 你 的 案例 
填 和 你 的 案例 填 人 你 的 案例 


x 培训 的 两 个 层级 和 性 别 


填 人 你 的 案例 填 人 你 的 案例 
填 人 你 的 案例 填 和 人 你 的 案例 


>л 培训 的 三 个 层级 .性 别 和 | 、 
三 因素 方差 分 析 收入 的 三 个 层级 选举 态度 


填 人 你 的 案例 填 入 你 的 案例 


2. 使 用 第 11 章 数 据 集 2(chapter 11 data 2) 和 SPSS, 计 算 游泳 者 每 周 训练 的 
平均 时 间 ( <15,15 -25 以 及 >25 小 时 ) 的 三 个 层级 比较 的 下 比率 ,被 解释 变量 
或 结果 变量 是 100 码 自 由 泳 时 间 。 回 答 这 个 问题 ,也 就 是 训练 时 间 是 否 产生 差 
异 。 不 要 忘记 使 用 Options 选项 得 到 群体 的 均值 。 
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练习 参考 答案 


分 组 变量 өлен 


培训 时 间 分 为 四 个 层级 一 一 
三 个 年 龄 群体 一 一 20 岁 、25 
r wP 2 ЕТА 


| 2х2 
两 因素 方差 分 析 ed a e i 
设计 ) 
三 个 年 龄 群体 一 一 5、10、15 
岁 ,兄弟 的 数量 ни 
5 培训 的 三 个 层级 ,性别 和 收入 | ， 
三 因素 方差 分 析 的 三 个 层级 选举 态度 


课程 类 型 (类 型 1 和 类 型 2)， 
ACT 成 绩 


GPA(3.0 以 上 和 以 下 ) ,以 及 
活动 参与 度 (参与 和 不 参与 ) 
2. 三 个 群体 的 均值 分 别 是 58. 05 % ,57. 96 秒 和 59.03 #,Е Ë ( F,, = 
. 160) ,差异 来 自 于 随机 因素 的 可 能 性 是 .853 , 远 远 大 于 我 们 预期 的 由 于 处 理 变 
量 引起 的 可 能 性 。 我 们 的 结论 是 什么 ? 训练 时 间 并 不 对 游泳 速度 产生 影响 。 
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本 章 你 会 学 到 什么 


o 何 时 使 用 一 个 以 上 因素 的 方差 分 析 
e 什么 是 主 效应 和 交互 效应 
e 如 何 使 用 SPSS 完成 析 因 方差 分 析 


析 因 方差 分 析 介 绍 


人 们 如 何 做 出 决策 已 经 成 为 迷惑 心理 学 者 几 十 年 的 问题 。 这 些 研究 
形成 的 数据 广泛 地 应 用 在 广告 学 商业、 规划 和 宗教 领域 。 米 尔 蒂 亚 德 - 
普罗 阿 斯 与 乔治 . 多 加 尼斯 (Miltiadis Proios & George Doganis ) 研究 积极 
参与 决策 过 程 (在 一 系列 的 条 件 下 ) 的 经 验 和 年 龄 如 何 对 道德 归 因 产生 影 
啊 。 研 究 样本 由 148 个 裁判 构成 一 一 56 个 足球 裁判 .55 个 篮球 裁判 以 及 
37 个 手球 裁判 。 他 们 的 年 龄 范围 是 17 ~ 50 岁 , 性 别 不 是 考虑 的 重要 变 
量 。 在 整个 样本 中 ,大约 8% 没有 社会 政治 或 运动 领域 全 面 参与 决策 制 
定 过 程 的 任何 经 验 , 大 约 53% 表现 积极 但 是 没有 全 面 参 与 ,大 约 39% AR 
现 积极 ,又 全 面 参与 一 些 组 织 中 的 决策 制定 。 二 元 方差 分 析 ( 在 第 17 章 可 
以 更 多 了 解 多 元 方差 分 析 ) 站 Н 
标定 位 的 交互 影响 。 

什么 是 二 元 方差 分 析 ? 很 容易 一 一 有 两 个 独立 因素 ,第 一 个 是 经 验 水 
平 , 第 二 个 是 年 龄 。 与 每 一 个 方差 分 析 程 序 相 类 似 , 包 括 

1. 对 年 龄 的 主 效应 的 检验 。 

2. 对 经 验 的 主 效应 的 检验 。 

3. 对 经 验 和 年 龄 的 交互 效应 的 检验 (结果 可 能 是 显著 的 ) 。 

在 检验 一 个 以 上 因素 或 者 独立 变量 时 就 体现 出 方差 分 析 的 一 个 重要 
特点 ,也 就 是 研究 者 可 以 分 析 每 一 个 因素 的 效应 ,同时 可 以 通过 交互 效应 
分 析 两 者 共同 的 效应 ,在 本 章 后 面 的 部 分 会 进行 更 多 的 讨论 。 

是 否 想 了 解 更 多 ? 查阅 原始 文献 :普罗 阿 斯 与 多 加 尼斯 (Proios,M. & 


150 


Аза, онар 


Doganis ,G. ) 2003 年 发 表 在 《感知 与 运动 技能 》( Perceptual and Motor 
Skills) 第 96(1) 期 113 ~ 126 页 的 文章 “积极 活动 的 经 验 、 决 策 制定 过 程 的 
参与 和 年 龄 对 裁判 的 道德 归 因 和 目标 定位 的 影响 。( Experience from ac- 
tive membership and participation in decision-making process and age in moral 


reasoning and goal orientation of referees) „” 
知识 和 智 识 路 径 


下 面 介绍 如 何 使 用 图 12.1 所 示 流 程 表 选 择 方差 分 析 ( 现 在 处 理 一 个 
以 上 的 因素 ) 作 为 合适 的 检验 统计 。 沿 着 图 中 加 黑 的 步骤 就 可 以 。 

就 如 在 第 11 章 一 样 ,我们 已 经 确定 方差 分 析 是 正确 的 选择 (检验 多 个 
群体 之 间 差 异 或 者 独立 变量 的 多 个 层级 之 间 的 差异 ) ,但 是 我 们 要 处 理 不 
止 一 个 因素 , 析 因 方差 分 析 是 正确 的 选择 。 








1 一 我 们 检验 不 同 群体 的 数值 之 间 的 差异 ,在 这 个 案例 中 是 检验 经 
验 水 平和 年 龄 之 间 的 差异 。 

2 一 参与 者 接受 一 次 测试 。 

3 一 我 们 检验 两 个 或 多 个 群体 。 

4 一 我 们 处 理 不 止 一 个 因素 或 独立 变量 。 

5 一 合适 的 检验 统计 是 析 因 方差 分 析 。 





方 汰 分 析 的 新 类 型 


你 已 经 了 解 方差 分 析 的 一 种 形式 ,也 就 是 第 11 章 讨论 的 简单 方差 分 
析 。 简 单方 差分 析 只 分 析 一 个 因素 或 者 处 理 变量 (如 群体 身份 ) ,而 且 这 
个 因素 或 者 处 理 变量 可 分 为 两 个 以 上 的 层级 或 群体 。 

现在 ,我 们 对 整个 技术 进行 发 展 ,进而 可 以 同时 分 析 不 止 一 个 因素 ,也 
就 是 析 因 方差 分 析 (factorial analysis of variance) 。 

现在 我 们 来 看 一 个 简单 的 包含 两 个 因素 的 案例 :性 别 ( 男 和 女 ) 和 处 
理 变 量 一 一 处 理 变 量 是 不 同类 型 的 训练 项 目 ( 高 强度 和 低 强 度 ) ,以 及 结 
采 一 一 体重 减少 的 数量 。 这 个 案例 的 实验 设计 类 似 于 : 


训练 项 目 





接着 我 们 来 看 什么 是 主 效 应 和 交互 效应 。 现 在 不 进行 更 多 的 数据 分 
析 ,在 本 章 的 最 后 才 会 相应 的 增加 数据 分 析 ,现在 只 是 看 和 了 解 。 
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就 析 因 分 析 来 说 你 可 以 提出 并 回答 三 个 问题 。 

1. 不 同 的 训练 项 目 层 级 也 就 是 高 强度 和 低 强 度 之 间 是 否 有 差异 ? 

2. 不 同性 别 一 一 男性 和 女性 之 间 是 否 有 差异 ? 

3. 高 强度 或 低 强 度 项 目 是 否 对 男性 或 女性 有 不 同 的 效应 ? 

问题 1 和 问题 2 确定 主 效应 是 否 存 在 ,问题 3 确定 两 个 因素 之 间 是 否 
有 交互 效应 。 


主要 方面 : 析 因 方差 分 析 的 主 效应 


你 应 该 记得 方差 分 析 的 最 初 目 标 是 检验 两 个 或 两 个 以 上 群体 之 间 的 差 
异 。 如 果 数 据 分 析 表 明 某 个 因素 的 不 同 层级 之 间 存 在 差异 ,我 们 就 会 说 存 
在 主 效应 (main effect) 。 现 在 来 看 一 个 例子 ,上 面 给 出 的 案例 中 共有 四 个 群 
体 ,每 个 群体 10 个 参与 者 ,总 共 是 40。 下 面 给 出 可 能 的 分 析 结 果 ( 我们 使 用 
SPSS 计算 得 出 这 个 紧凑 的 表格 ) 。 这 个 表 也 叫做 源 表 ( source table) 。 


主 效应 与 交互 效应 检验 
被 解释 变量 :LOSS 





3 678.275 
232 715. 025 
429. 025 

3 222.025 


1 226. 092 
232 715.025 
429.025 

3 222.025 


来 源 第 三 类 平方 Фф 均 方 F Sig. 
5 x 3 | ; ç 
l 
l 
1 


27.225 27.225 

5 129.700 142. 492 
241 523.000 
8 807.975 





现在 只 关注 来 源 列 和 siz. 列 ( 已 经 用 阴影 显示 ) 。 我 们 可 以 得 出 的 结 
论 是 性 别 有 主 效应 (P = . 000) ,而 处 理 变量 没有 主 效 应 (P = .091) ,而 且 这 
两 个 主要 因素 之 间 没 有 交互 效应 (p =. 665) 。 因 此 在 高 强度 组 或 低 强 度 
组 对 减少 体重 来 说 并 不 重要 ,但 是 性 别 是 重要 的 影响 因素 。 而 且 处 理 因素 
和 性 别 之 间 没 有 交互 效应 ,所 以 不 同 的 强度 对 性 别 没有 差异 性 影响 。 

如 果 将 对 应 的 均值 绘图 ,就 会 得 到 图 12. 2 的 形象 展示 。 

在 图 12.2 中 你 可 以 看 到 男性 和 女性 在 “ 减 重 (Loss)” 轴 相差 的 距离 很 
大 (男性 的 均值 是 85. 25 ,女性 的 均值 是 67. 30)。 但 是 对 处 理 变量 来 说 
(如 果 你 计算 了 平均 值 ) ,你 会 发 现 差异 很 小 (高 强度 项 目的 均值 是 73.00, 
低 强度 的 均值 是 79. 55)。 当 然 现 在 是 进行 方差 分 析 , 群 体内 的 变化 很 重 
要 ,但 是 在 这 个 案例 中 ,你 可 以 看 到 每 一 个 因素 (如 性 别 ) 的 群体 间 的 差异 
(如 男性 和 女性 ) 以 及 他 们 如 何在 分 析 结 果 中 反映 。 
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高 强度 低 强度 
处 理 变量 


图 12.2 处理 变量 对 应 男性 和 女性 的 均值 
更 有 趣 的 方面 :交互 效应 


现在 开始 讨论 交互 效应 。 先 看 一 组 新 数据 的 源 表 ,这 些 数据 表明 男性 
和 女性 受到 处 理 变量 的 影响 ,也 就 是 存在 交互 效应 (interaction effect) 。 而 
且 你 还 可 以 看 到 一 些 非常 有 趣 的 分 析 结 果 。 





主 效应 与 交互 效应 检验 
被 解释 变量 :LOSS 
来 源 第 三 类 平方 和 df 均 方 F Sig. 
Uy —Z PPE s L NPP Л Е ЕЗЕН _ 

Corrected Model F522 875 3 507.625 4.678 .007 
Intercept 218 892. 025 1 218 892. 025 2017.386 .000 
ТКЕАТМЕМ 265. 225 1 265.225 2.444 .127 
GENDER 207.025 1 207.025 1.908 .176 
ТКЕАТМЕМ ж 
GENDER i 1 050. 625 1 1 050. 625 9.683 .004 
Еттог 3 096.100 36 108. 503 
Total 224 321.000 40 
Corrected Тойа! 5 428,975 39 





处 理 变量 和 性 别 没 有 主 效应 (分 别 为 p =. 127 ,р =.176) ,但 是 存在 交 
互 效 应 (p =.004) ,这 是 一 个 非常 有 意思 的 结果 。 实 际 上 ,你 是 在 高 强度 
项 目 或 者 低 强度 项 目 或 者 你 是 男性 或 者 女性 都 不 重要 ,但 是 处 理 变量 对 于 
男性 和 女性 的 体重 减少 有 不 同 的 影响 。 

现在 给 出 四 个 群体 的 均值 的 图 形 展示 (图 12.3 ж). 


14 42%%% argy% 





高 强度 低 强度 
处 理 变量 


图 12.3 处理 变量 对 男性 和 女性 的 均值 


下 面 列 出 实际 的 均值 大 小 (应 用 SPSS 计算 ): 


男性 均值 女性 均值 
高 强度 73.70 78. 80 
低 强 度 79.40 64.00 


如 何 理解 这 个 结果 ? 解释 非常 简洁 。 下 面 是 我 们 可 以 做 出 的 解释 ,就 
如 你 可 以 认识 到 的 ,这 是 之 前 列 出 的 三 个 问题 的 答案 。 

训练 类 型 没有 主 效应 。 

性 别 没 有 主 效应 。 

处 理 变量 和 性 别 之 间 有 明显 的 交互 效应 ,也 就 是 说 在 高 强度 项 目 中 女 
性 减少 的 体重 比 男 性 减少 的 体重 多 ,而 在 低 强度 项 目 中 男性 减少 的 体重 比 
女性 减少 的 体重 多 。 


需要 记忆 的 内 容 


这 是 特别 需要 记忆 的 内 容 。 如 果 没 有 掌握 更 多 的 知识 (也 没 

有 持续 学 习 到 本 章 ) ,你 可 能 会 认为 你 必须 做 的 所 有 分 析 都 是 男性 

с 和 女性 均值 之 间 的 :检验 ,或 者 参与 高 强度 训练 项 目的 群体 和 参与 

低 强 度 项 目的 群体 的 均值 之 间 的 另 一 种 简单 的 :1 检验 一 一 不 过 你 

不 会 有 所 发 现 。 但 是 如 果 考 虑 到 主要 因素 之 间 的 交互 效应 ,就 会 

发 现 不 同 的 效应 的 存在 一 一 这 是 其 他 的 分 析 没 有 注意 到 的 结果 。 

实际 上 你 不 但 可 以 接受 这 项 结果 ,而 且 交 互 效 应 是 任何 析 因 方差 
分 析 中 最 有 趣 的 结果 。 


计算 检验 统计 量 


现在 要 面 对 一 种 改变 。 在 《 爱 上 统计 学 》 整 本 书 中 ,我 们 提供 


y zS 
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一 定 的 案例 展示 如 何 使 用 老 的 方式 (使 用 计算 器 手动 计算 ) 或 者 应 
用 类 似 SPSS 的 统计 分 析 软 件 包 进行 特定 的 统计 分 析 。 对 于 析 因 
方差 分 析 的 介绍 ,我 们 只 使 用 SPSS 来 说 明 一 一 这 不 是 由 于 应 用 计 
算 器 完成 析 因 ANOVA 更 具 知 识 上 的 挑战 性 ,而 是 由 于 计算 工作 量 
太 大 。 正 是 由 于 这 个 原因 我 们 不 准备 手动 进行 所 有 的 计算 ,而 是 
直接 对 重要 的 值 进行 计算 ,并 且 将 更 多 的 时 间 用 在 解释 方面 。 

我 们 使 用 之 前 展示 的 存在 显著 的 交互 效应 的 那 组 数据 。 


处 理 变 量 一 一 ， 高 强度 高 强度 低 强 度 低 强度 





AE а ы Н РУ”. асал... 
76 65 88 65 
78 90 76 67 
76 65 76 67 
76 90 76 87 
76 65 56 78 
74 90 76 56 
74 90 76 54 
76 79 98 56 
76 70 88 54 


55 90 78 56 


下 面 是 著名 的 八 个 步骤 和 下 检验 统计 量 的 计算 。 

1. 零 假设 和 研究 假设 的 表述 。 实 际 上 这 里 出 现 的 零 假 设 有 三 个 ( 公 
IÑ 12.1а,12.1Ь,12.1с) ,表明 两 个 因素 的 均值 之 间 没 有 差异 ,没有 交互 效 
应 。 现 在 就 具体 描述 。 

首先 ,对 处 理 变 量 来 说 … 


By: pu шы (12.la) 
对 性 别 变量 来 说 ， 

和 (12. 1b) 
对 处 理 变量 和 性 别 之 间 的 交互 效应 来 说 ， 


H, : Hhighxmale = Hhighxfemale = Miowxmale = ËLlowxfemale (12. 1с) 


公式 12.2a,12. 2b ,12. 2c 所 示 为 研究 假设 ,表明 群体 的 均值 之 间 有 差 
异 , 而 且 存 在 交互 效应 。 具 体 如 下 。 
首先 ,对 处 理 变 量 来 说 … 


H, : Х.д 天 Х,, (12.2а) 
对 性 别 变 量 来 说 ， 
Р зе Жз, (12.2Ь) 


对 处 理 变量 和 性 别 之 间 的 交互 效应 来 说 ， 


156 472%9% 爱人 上 统计 学 


ил ж ыма зі ЕР Жі 22. (12. 2c) 

2. 设置 零 假 设 的 风险 水 平 (或 显著 性 水 平 , 或 第 一 类 错误 ) 。 风 险 水 
平 或 第 一 类 错误 或 显著 水 平 是 .05。 再 一 次 强调 ,风险 水 平 完全 由 研究 者 
决定 。 

3. 选择 合适 的 检验 统计 量 。 使 用 图 12.1 所 示 的 流程 表 , 我 们 确定 合 
适 的 检验 方法 是 析 因 方差 分 析 。 

4. 计算 检验 统计 值 (也 叫做 实际 值 )。 我 们 使 用 SPSS 来 计算 ,并 给 出 
具体 的 运行 步骤 。 我 们 使 用 上 面 给 出 的 数据 ,这 些 数据 可 以 从 网 上 下 载 ， 
数据 集 名 称 是 第 12 章 数 据 集 1( chapter 12 data 1)( 也 在 附录 C 中 列 出 )。 
; 在 数据 编辑 栏 录 入 数据 ,或 打开 数据 文件 。 要 确保 每 一 个 因 

©. 素 也 就 是 处 理 变量 和 性 别 在 不 同 的 列 ,如 图 12.4 Жж. 


Ei Chapter 12 Data Set 1 - SPSS Data Editor 





High Impac| Male 


76 
76 
74 


S| High mpac| Male 
| High mpac| — Мае 
| High трас — Mae 76 


Ç Й ТЕ 10) High Impac Male 





图 12.4 第 12 章 数据 集 1 的 数据 
5. 点 击 Analyze 一 Ceneral Linear Model 一 Univariate ,你 会 看 到 如 图 12.5 


所 示 析 因 方 差分 析 对 话 框 。 

6. 点 击 变 量 loss, 然 后 点 击 P> 将 选中 的 变量 移 到 Depend Variable 
HEF, 

27. 点击 变 量 treatment, # J; д h P> 将 选中 的 变量 移 到 Fixed Factors 

ЖЕЗ. 

8. 点 击 变量 gender, 然后 点 击 P> 将 选中 的 变量 移 到 Fixed Factors 
框 中 。 

9. 点 击 Opertions ,接着 点 击 Descriptives ,然后 点 击 Continue。 

10. 点 击 OK。SPSS 执行 分 析 过 程 , 然 后 得 出 图 12.6 所 示 的 结果 。 
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\ Univariate 





В 12.5 析 因 方差 分 析 对 话 框 
Univariate Analysis of Variance 


Between-Subjects Factors 


Value Label | N | 


GENDER 


TREATMEN 


Tests of Between-Subjects Effects 
Dependent Variable:LOSS 


= Model 1 522.875" 507 t 4.678 
Intercept 218 892.025 218 892.025 2 017.386 
GENDER 207.025 207.025 1.908 
TREATMEN 265.225 265.225 2.444 
GENDER*TREATMEN 1 050.625 1 050.625 9.683 
Error 3 906.100 108.503 

Total 224 321.000 ` 

Corrected Total 5 428.975 


a.R Squared=.281(Adjusted R Squared=.221) 





Ш 12.6 析 因 方差 分 析 的 SPSS 输出 结果 
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< 一 — 








r @ 为 什么 SPSS 的 输出 结果 的 标签 为 Univariate Aanalysis of Vari- 
Z š Ñ ance( 单 变量 方差 分 析 )? 也 许 你 想 知道 。 就 SPSS 而 言 ,这 项 分 析 
6 只 处 理 一 个 被 解释 变量 或 者 结果 变量 在 我 们 的 这 个 案例 中 就 


是 体重 减少 。 如 果 我 们 的 研究 问题 中 不 止 一 个 变量 (如 对 吃 的 态 
BE) ,那么 就 是 多 元 方差 分 析 ,在 检验 群体 差异 的 同时 要 控制 独立 
变量 之 间 的 关系 。 第 17 章 会 讨论 更 多 的 内 容 。 





SPSS 输出 结果 的 含义 


SPSS 的 输出 结果 很 明确 。 下 面 就 是 我 们 得 到 的 内 容 。 
1. 我 们 确定 的 方差 来 源 组 间 \ 组 内 和 总 的 方差 。 
2. 接着 我 们 确定 不 同 来 源 的 平方 和 。 
3. 紧 接 着 是 自由 度 , 以 及 平方 和 均值 ( 均 方 ) ,也 就 是 平方 和 除 以 自 
由 度 。 
4. 最 后 就 是 实际 值 和 相应 的 准确 的 显著 水 平 。 
5. 对 性 别 来 说 ,在 期 刊 或 者 报告 中 出 现 的 结果 形式 类 似 于 Fa = 
1.908,Р-.176, 
б. 对 处理 变量 来 说 ,在 期 刊 或 者 报告 中 出 现 的 结果 形式 类 似 于 
Ез =2. 444 ,已 =.127。 
7. 对 交互 效应 来 说 ,在 期 刊 或 者 报告 中 出 现 的 结果 形式 类 似 于 
F a.) =9.683 ,已 =.004。 
现在 都 已 经 完成 。 
— аа атар ааа m 
小 结 
我 们 已 经 完成 了 群体 均值 之 间 差 异 的 检验 , 接 下 来 要 研究 相关 关系 的 显著 
性 ,或 者 说 两 个 变量 之 间 的 关系 。 





练习 时 间 
1. 何 时 使 用 析 因 方差 分 析 而 不 是 简单 方差 分 析 检 验 两 个 或 更 多 群体 之 间 差 
жып Ж (Е. 
2. 建立 可 以 进行 析 因 方差 分 析 的 2 x3 实验 设计 。 
3. 使 用 第 12 章 数据 集 2(chapter 12 data 2) ,用 SPSS 完成 分 析 并 解释 结果 。 
这 是 一 个 2 x3 实验 设计 ,类 似 于 问题 2 要 求 的 答案 。 


练习 参考 答案 
1. 很 容易 , 析 因 方差 分 析 只 用 于 不 止 一 个 因素 和 独立 变量 的 分 析 。 当 你 假 
设 交互 作用 的 存在 时 ,实际 上 获得 结果 不 是 很 容易 (但 是 只 要 你 获得 结果 ,你 就 
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会 真正 理解 ) 。 
2. 这 里 可 以 给 出 许多 不 同 的 可 能 的 案例 ,下 面 是 其 中 之 一 。 一 个 处 理 变量 
(因素 ) 有 三 个 层级 ,疾病 严重 性 分 为 两 个 层级 。 





3. 源 表 类 似 如 下 所 示 : 


主 效应 与 交互 效应 检验 

被 解释 变量 :PAIN_SCO 
来 源 第 三 类 平方 和 df FJ Jy F Sig. 
Corrected Model 266.742 5 53.348 26.231 ‚000 
Intercept 3 070. 408 1 3 070. 408 1 509.711 .000 
SEVERITY .075 1 .075 .037 .848 
TREATMEN 263.517 2 131.758 64.785 .000 
SEVERITY * 
TREATMEN 3.150 2 1.573 .774 .463 
Error 231.850 114 2.034 
Total 3 569.000 120 
Corrected Total 498.592 119 


就 我 们 的 解释 来 说 ,在 这 个 数据 集中 ,疾病 严重 性 没有 主 效应 ,处 理 变 量 有 
主 效应 ,两 个 主要 因素 之 间 没 有 交互 效应 。 


近 杀 还 是 好 朋友 
使 用 相关 系数 检验 关系 БЕ 





本 章 你 会 学 到 什么 





o 如 何 检 验 相 关系 数 的 显著 性 

° 相关 系数 的 解释 

e° 显著 性 和 有 意义 的 重要 区 别 

° 如 何 使 用 SPSS 分 析 有 相关 关系 的 数据 以 及 如 何 理 解 分 析 结 果 


相关 系数 检验 的 介绍 


丹尼尔 ' 舍 克 (Daniel Shek) 在 他 研究 婚姻 质量 与 父母 -子女 关系 的 文 
章 中 告诉 我 们 至 少 存在 两 种 可 能 性 。 首 先 ,失败 的 婚姻 可 能 促进 父母 - 子 
女 关 系 。 这 是 由 于 父母 对 婚姻 不 满意 ,就 可 能 以 与 子女 的 关系 替代 夫妻 关 
系 来 实现 情感 的 满足 。 另 外 ,依据 进一步 的 假设 ,失败 的 婚姻 也 可 能 破坏 
父母 -子女 关系 。 这 是 由 于 失败 的 婚姻 可 能 增加 了 抚养 子女 的 困难 。 

EWA T 378 对 中 国 夫 妇 2 年 期 内 的 婚姻 质量 与 父母 -子女 关系 之 
闻 的 关系 。 他 发 现 婚姻 质量 水 平 越 高 ,父母 -子女 关系 水 平 也 越 高 ;截面 
(现时 ) 数 据 和 纵向 (一 定时 期 ) 数 据 都 支持 这 项 发 现 。 他 也 发 现 父 母 - 子 
女 关 系 的 强度 对 父亲 和 母亲 是 一 样 的 。 这 是 一 个 明显 的 例证 ,可 以 说 明 如 
何 使 用 相关 系数 给 出 我 们 需要 的 关于 一 个 变量 和 另 一 个 变量 相关 的 信息 。 
舍 克 全 面 计算 了 时 期 1 \ 时 期 2 与 父亲 和 母亲 之 间 不 同 的 相关 关系 ,所 有 
的 计算 的 目的 都 相同 :确定 变量 之 间 是 否 显著 相关 。 要 记 住 ,这 不 是 说 变 
量 关 系 存 在 任何 因果 性 ,只 是 说 一 个 变量 和 另 一 个 变量 相关 。 

如 果 想 了 解 更 多 ,请 查阅 舍 克 (Shek , D. T. L. )1998 年 发 表 在 《家 庭 问 
题 杂 志 》( Journal of Family Issues) 第 19 期 687 ~704 页 的 文章 “婚姻 质量 
和 父母 -子女 关系 之 间 的 关系 ( Linkage between marital quality and parent- 
child relationship) „” 


知识 和 智 识 路 径 


Мдааа йынын ана қауы Ж Wr 
ЖИН 13.1 中 加 黑 的 步骤 就 可 以 。 
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1 一 我 们 检验 变量 之 间 的 关系 而 不 是 群体 之 间 的 差异 。 
2 一 只 检验 两 个 变量 之 间 的 关系 。 
3 一 所 要 应 用 的 合适 的 检验 统计 量 是 相关 系数 的 t 检验 。 








计算 检验 统计 量 


你 会 喜欢 看 到 下 面 的 资料 :相关 系数 本 身 可 以 作为 自己 的 检验 统计 
量 。 你 不 需要 计算 任何 检验 统计 量 , 而 且 检 验 显著 性 也 非常 的 容易 ,这 使 
事情 变 得 相当 简单 。 

我 们 现在 利用 下 面 的 一 组 数据 举例 说 明 两 个 变量 一 一 也 就 是 婚姻 质 
量 和 父母 -子女 关系 水 平一 一 之 间 关 系 的 检验 ， 





婚姻 质量 父母 -子女 关系 水 平 
76 43 
81 33 
78 23 
76 34 
76 31 
78 51 
76 56 
78 43 
98 44 
88 45 
76 32 
66 33 
44 28 
67 39 
65 31 
59 38 
87 21 
77 27 
79 43 
85 46 
68 41 
76 41 
77 48 
98 56 
99 55 
98 45 
87 68 
67 54 
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可 以 应 用 第 5 章 的 公式 5. 1 计算 皮尔 森 相 关系 数 。 具 体 计算 时 你 会 
得 到 的 结果 是 ~=.393 。 现 在 我 们 按 步骤 检验 这 个 值 的 显著 性 ,并 且 确 定 
这 个 值 的 含义 。 

下 面 是 著名 的 八 个 步骤 和 检验 统计 量 的 计算 。 

1. 零 假 设 和 研究 假设 的 表述 。 零 假设 是 婚姻 质量 和 父母 -子女 关系 之 
间 没 有 关系 。 研 究 假设 是 双 侧 的 无 方向 的 假设 ,因为 研究 假设 只 是 陈述 两 
个 变量 之 间 有 关系 ,而 方向 并 不 重要 。 记 住 相关 可 能 是 正 向 的 或 负 疝 的 ， 
但 相关 系数 最 重要 的 特征 是 它 的 绝对 值 大 小 而 不 是 符号 ( 正 或 者 负 )。 

零 假 设 如 公式 13.1 所 示 : 

H, : pv =0 (12:1) 
希腊 字母 р 或 rho 表示 相关 系数 的 总 体 估计 。 

研究 假设 (公式 13.2 所 示 ) 表 示 两 组 值 之 间 有 关系 ,而 且 这 个 关系 值 
不 等 于 0。 


H, : т, »20 


ху 





2. 设置 零 假 设 的 风险 水 平 (或 显著 性 水 平 , 或 第 一 类 错误 ) 。 风 险 水 
平 或 第 一 类 错误 或 显著 水 平 是 .05 。 

3. 和 4. 选择 合适 的 检验 统计 量 。 使 用 图 13.1 所 示 的 流程 表 ,我 们 确 
定 用 于 相关 系数 的 合适 的 检验 。 在 这 个 案例 中 ,我 们 不 需要 计算 检验 统计 
量 ,因为 简单 的 > 值 (r, =. 393) 就 我 们 的 检验 目的 来 说 就 是 我 们 的 检验 统 
计量 。 

5. 使 用 特定 统计 量 的 合适 的 临界 值 表 来 确定 拒绝 零 假 设 需要 的 值 。 
附录 В 的 表 B4 列 出 了 相关 系数 的 临界 值 。 

首先 我 们 要 确定 自由 度 (4df) ,自由 度 近 似 样本 规模 。 就 现在 的 检验 统 
计量 来 说 ,自由 度 是 n -2, 或 者 29 -2 =27 ,其 中 n 等 于 用 于 计算 相关 系数 
的 配对 数量 。 这 里 的 自由 度 只 适合 于 这 项 统计 检验 ,但 不 是 其 他 统计 检验 
所 需要 的 。 

使 用 自由 度数 值 (27) 你 愿意 承担 的 风险 水 平 (. 05 ) 和 双 侧 检验 ( 因 
为 研究 假设 没有 方向 ) ,临界 值 是 .349( 使 用 df = 30 ,30 是 最 接近 的 数字 )。 
因此 对 显著 水 平 为 .05 、 自 由 度 为 27 的 双 侧 检验 来 说 ,我 们 拒绝 零 假设 需 
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要 的 值 是 .349 。 
ë 好 了 ,我 们 有 点 儿 投 机 取 巧 。 实 际 上 你 可 以 计算 上 值 ( 类 似 于 


不 同 均值 之 间 差 异 的 检验 ) 检 验 相关 系数 的 显著 性 。 计 算 公 式 并 
不 比 之 前 几 章 学 到 的 公式 难 , 但 是 你 不 会 在 本 章 看 到 。 重 点 是 一 
些 聪明 的 统计 学 家 已 经 计算 了 在 不 同 显著 水 平 下 (.01,. 05) 不 同 
样本 规模 的 单 侧 检验 和 双 侧 检验 临界 7 值 ,就 如 表 ВА 所 示 。 如 果 
你 在 读 专 业 期 刊 时 看 到 过 使 用 i 值 检 验 相 关 关 系 , 现 在 你 知道 这 是 
为 什么 了 吧 。 





\ by 


КоА 


б. 比较 实际 值 和 临界 值 。 实 际 值 是 . 393 ,拒绝 零 假设 也 就 是 两 个 变量 
不 相关 的 临界 值 是 . 349. 

7. 和 8. 做 出 决定 。 现 在 我 们 该 做 出 决定 了 。 如 果实 际 值 (或 者 检验 
统计 量 的 值 ) 大 于 临界 值 ( 表 中 列 出 的 值 ) 就 不 能 接受 零 假设 。 如 果实 际 
值 没 有 超过 临界 值 , 零 假 设 就 是 最 有 力 的 解释 。 i 

在 这 个 案例 中 ,实际 值 (.393 ) 超 过 临界 值 (. 349 ) 一 一 这 个 值 足够 大 ， 
我 们 可 以 说 两 个 变量 (婚姻 质量 和 父母 -子女 关系 ) 之 间 确 实 存在 由 于 随 
机 因素 之 外 的 某 些 因素 引起 的 某 种 关系 。 


那么 如 何 解 释 r, =.393,p <.05 


er 表示 我 们 使 用 的 检验 统计 量 。 

。27 是 自由 度数 值 。 

。.393 是 实际 值 , 是 使 用 第 5 章 给 出 的 公式 计算 所 得 的 值 。 

。P<.05( 实 际 上 是 这 个 简短 表达 式 中 最 重要 的 部 分 ) 表示 对 零 假 设 
的 任何 检验 来 说 ,两 个 变量 之 间 的 关系 是 由 于 随机 因素 引起 的 可 能 性 小 于 
5% 。 因 为 我 们 以 05 作为 研究 假设 比 零 假设 更 有 人 解释 力 的 标准 ,我 们 的 
结论 就 是 两 个 变量 之 间 的 关系 是 显著 的 。 这 意味 着 随 着 婚姻 质量 水 平 的 
提高 父母 -子女 关系 的 水 平 也 提高 。 相 应 的 , 随 着 婚姻 质量 水 平 的 降低 父 
母 -子女 关系 的 水 平 也 降低 。 
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因果 和 相关 (再 次 说 明 ) 


你 可 能 认为 你 已 经 对 因果 和 相关 有 了 足够 的 了 解 ,但 是 这 一 点 太 重 要 
了 ,因此 我 们 不 得 不 再 申明 一 次 。 仅 仅 因为 两 个 变量 相互 相关 ( 类似 上 面 
给 出 的 案例 ) ,并 不 表示 一 个 变量 变化 就 引起 另 一 个 变量 的 变化 。 换 句 话 
说 ,婚姻 质量 高 并 不 能 保证 父母 -子女 关系 水 平 也 高 。 这 两 个 变量 可 能 因 
为 共享 共同 的 一 些 使 得 一 个 人 成 为 好 丈夫 、 好 妻子 或 好 父母 的 特质 ( 耐 
心 、 领 悟 力 ,牺牲 的 意愿 ) 而 相关 ,但 是 也 有 相当 的 可 能 看 到 好 些 可 以 成 为 
好 丈夫 或 好 妻子 的 人 与 子女 的 关系 相当 糟糕 。 

是 否 还 记得 第 5 章 的 犯罪 和 冰淇淋 的 案例 ”在 本 章 也 一 样 。 仅 仅 因 
为 变量 相关 并 分 享 一 些 共同 的 特征 并 不 表意 味 着 这 两 个 变量 之 间 存 在 因 
果 关 系 。 


显著 性 和 意义 (强调 ,一 遍 又 一 遍 ) 


在 第 5 章 我 们 对 使 用 决定 系数 理解 相关 系数 的 意义 进行 了 评述 。 你 
可 能 记得 相关 系数 的 平方 可 用 于 确定 一 个 变量 的 方差 可 以 解释 另 一 个 变 
量 方差 的 程度 。 在 第 8 章 我 们 也 讨论 了 显著 性 与 意义 的 问题 。 

但 是 我 们 需要 再 一 次 讨论 这 个 主题 。 即 使 相关 系数 是 显著 的 (就 如 
本 章 的 案例 ) ,并 不 意味 着 可 以 解释 的 方差 的 程度 是 有 意义 的 。 例 如 ,在 
这 个 案例 中 ,简单 皮尔 森 相 关 值 . 393 的 决定 系数 等 于 . 154, 这 表明 可 以 解 
释 方 差 的 15.4% ,而 方差 的 84. 6% 不 能 解释 。 这 就 留 下 了 很 大 的 质疑 空 
间 ,对 吧 ? 

因此 ,即使 我 们 知道 婚姻 质量 和 父母 -子女 关系 之 间 有 正 向 的 关系 ,这 
两 个 变量 可 能 “ 走 ” 在 一 起 ,但 是 这 么 小 的 相关 系数 .393 表明 在 这 两 个 变 
量 的 关系 中 还 有 其 他 很 重要 的 因素 在 发 挥 作用 。 因 此 ,你 可 能 会 想到 统计 
学 中 的 一 句 谚语 ,“ 你 看 到 的 并 不 总 是 你 得 到 的 ”。 


使 用 计算 机 计算 相关 系数 


现在 我 们 使 用 第 13 章 数 据 集 1 ( chapter 13 data set 1) ,这 个 数 


据 集中 有 两 个 测量 指标 个 是 婚姻 (共度 的 时 间 , 有 三 个 分 类 
项 目 ) , 另 一 个 是 父母 -子女 关系 (影响 力 ) 。 
1. 在 数据 编辑 栏 录 入 数据 (或 打开 数据 文件 ) 。 要 确保 每 一 个 


变量 对 应 一 列 。 在 图 13.2 中 你 可 以 看 到 每 一 列 开 始 的 标签 分 别 
为 qual_mar( 婚姻 质量 ) 与 qual_pc( 父 母 - 子 女 关 系 )。 








p 
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图 13.2 第 13 章 数据 集 1 数据 
2. 点 击 Analyze 一 Correlate 一 Bivariate ,你 就 会 看 如 图 13.3 所 示 
Bivariate Correlations 对 话 框 。 





图 13.3 双 变 量 相关 分 析 对 话 框 





3. 双击 变量 ааа! рс 将 变量 移 到 Variable(s ) 框 中 ,接着 双击 变 
量 qual_pc 将 变量 移 到 Variable(s) 框 中 。 
4. 点 击 Two-tailed 进行 双 侧 检验 。 
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5. 点 击 ОК. SPSS 执行 分 析 过 程 然后 得 出 图 13.4 所 示 的 


--- Correlations 


Correlations 


a a ШОШ 22 


“ ОСАІ, МАК Реагвоп Correlation 


QUAL_PC Pearson Correlation 
(2-tailed) 


чү? 





图 13.4 相关 系数 显著 性 检验 的 SPSS 输出 结果 
SPSS 输出 结果 的 含义 


SPSS 的 输出 结果 简单 明确 。 

两 个 变量 之 间 的 相关 系数 是 . 024 ,在 . 05 的 显著 水 平 下 是 不 显著 的 ， 
但 是 更 准确 地 说 就 是 犯 第 一 类 错误 的 概率 是 .891。 这 意味 着 零 假设 为 真 
(两 个 变量 不 相关 ) 的 情况 下 拒绝 零 假 设 的 可 能 性 是 89. 1% 这 可 是 很 
可 怕 的 概率 。 








小 结 
相关 系数 是 指出 关系 的 方向 并 帮助 我 们 更 好 地 理解 两 个 结果 变量 共享 的 内 
容 的 重要 工具 。 要 记 住 相关 只 适用 于 相互 关系 而 不 是 因果 关系 。 


练习 时 间 

1. 参照 下 面 给 出 的 信息 ,使 用 附录 B 的 表 Ва 确定 相关 系数 是 否 显著 ,以 及 
如 何 解 释 结 果 。 

a. 20 个 妇女 的 速度 和 力量 之 间 的 相关 系数 是 .567。 在 .05 的 显著 水 平 下 使 
用 单 侧 检验 来 检验 结果 。 

b. 数学 考试 中 回答 正确 的 问题 数量 和 完成 考试 的 时 间 之 间 相 关系 数 是 
-.45。 在 .05 的 显著 水 平 下 检验 80 个 孩子 的 相关 系数 是 否 显著 。 选 择 单 侧 检 
验 或 双 侧 检验 ,并 给 出 解释 。 

c. 50 个 青少年 朋友 的 数量 和 平均 成 绩 (GPA) 之 间 的 相关 系数 .37。 在 .05 
的 显著 水 平 下 双 侧 检验 是 否 显著 ? 

2. 使 用 第 13 章 数 据 集 2(chapter 13 data 2 ) 回答 下 面 的 问题 。 手 动 计算 或 者 
使 用 SPSS。 
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а. 计算 动机 和 GPA 之 间 的 相关 系数 。 
b. 使 用 双 侧 检验 在 .05 的 显著 水 平 下 检验 相关 系数 是 否 显著 。 
то ире 你 的 选择 是 什么 并 解释 。 
3. 讨论 并 举例 说 明 ( 类 似 冰 淇 淋 和 犯罪 的 例子 ) : : 两 个 变量 相关 就 意味 着 一 
个 变量 的 变化 会 引起 另 一 个 变量 的 变化 。 


练习 参考 答案 

la. 自由 度 是 18(df=n -2) 、 显 著 水 平 是 .05 的 情况 下 拒绝 零 假设 的 临界 值 
是 .516。 速 度 和 力量 之 间 是 显著 相关 ,而且 相关 系数 解释 方差 的 32.15% 。 

lb. 自由 度 是 78、 显 著 水 平 是 .05 的 情况 下 单 侧 检验 拒绝 零 假设 的 临界 值 
是 .183。 所 以 正确 的 数量 和 完成 时 间 之 间 显 著 相 关 。 因 为 研究 假设 变量 间 关 系 
是 负 向 的 ,所 以 使 用 单 侧 检验 ,而 且 大 约 解释 方差 的 209%5 。 
| le. 自由 度 是 48、 显 著 水 平 是 . 05 的 情况 下 双 侧 检验 拒绝 零 假 设 的 临界 值 
是 .273。 所 以 朋友 的 数量 和 可 能 取得 的 GPA 之 间 显 著 相 关 , 而 且 相 关系 数 可 以 
解释 方差 的 13.69% 。 

2а 与 2b. 我 们 使 用 SPSS 计算 得 出 相关 系数 为 0.434, 显 著 水 平 为 .017 的 双 
侧 检验 是 显著 的 。 图 13.5 给 出 最 后 的 分 析 结 果 。 


Correlations 


Correlations 


Ft 


Pearson Correlation .434* 
mg (2-tailed) .017 
30 


Pearson Correlation .434* 
жы (2-tailed) 


*.Correlation is significant at the 0.05 level (2-tailed) 





Ш 13.5 # 13 章 数据 集 2 的 SPSS 输出 结果 

2с. 正确 。 动 机 水 平 越 高 越 愿 意 学 习 ; 而且 学 习 越 多 ,动机 水 平 也 越 高 。 但 
是 (很 重要 的 “但 是 ”) 更 多 的 学 习 并 不 能 引起 更 高 的 动机 水 平 ,同样 的 更 高 的 动 
机 水 平 并 不 能 导致 更 多 的 学 习 。 

3. 这 个 案例 是 学 习 的 时 间 和 第 一 次 统计 学 考试 成 绩 。 这 两 个 变量 不 是 因果 
上 相关 。 例 如 ,你 的 同学 因为 不 理解 内 容 ,即使 学 习 了 几 个 小 时 ,但 是 学 习 效 果 
很 差 ,而 有 的 同学 可 能 在 其 他 课程 学 习 了 同样 的 内 容 ,即使 不 学 习 成 绩 也 很 好 。 
假设 我 们 强迫 一 些 人 在 考试 前 四 个 晚上 坐 在 书桌 前 每 晚 学 习 10 个 小 时 ,这 能 保 
证 他 或 者 她 得 到 好 的 成 绩 ? 当然 不 能 。 不 能 因为 变量 相关 就 认为 其 中 一 个 变量 
的 变化 就 会 引起 另 一 个 变量 的 变化 。 


ИЙЕ ИНД 
一 使 用 性 加 有 





本 章 你 会 学 到 什么 


e 如 何 进 行 估计 ,估计 如 何 应 用 在 社会 科学 和 行为 科学 中 

° 以 一 个 变量 估计 另 一 个 变量 时 如 何以 及 为 什么 进行 线性 回归 
e 如 何 判 断 估计 的 准确 性 

° 多 元 回归 的 应 用 





什么 是 估计 


现在 简短 地 介绍 一 下 。 你 不 仅 可 以 计算 两 个 变量 相关 的 程度 (就 如 
在 第 5 章 一 样 计算 相关 系数 ) ,也 能 够 以 相关 系数 为 基础 通过 一 个 变量 的 
值 计算 男 一 个 变量 的 值 。 这 是 如 何 应 用 相关 的 非常 特别 的 案例 ,而 且 相 关 
是 社会 和 行为 科学 研究 者 的 强 有 力 的 工具 。 

佑 计 的 基本 含义 就 是 使 用 已 经 收集 的 数据 集 ( 如 变量 Х,У 的 数据 )， 
计算 变量 如 何 相关 ,接着 使 用 相关 系数 以 及 XX 的 信息 来 估计 Y。 听 起 来 有 
些 难 ? 实际 上 不 难 , 特 别 是 通过 例证 对 估计 有 了 了 人 解 之 后 。 

例如 ,研究 者 收集 了 400 个 州立 大 学 的 学 生 高 中 时 期 所 有 的 平均 成 绩 
(GPA) 和 大 学 第 一 年 的 GPA。 他 计算 了 这 两 个 变量 之 间 的 相关 系数 。 接 着 
他 使 用 你 将 在 本 章 学 到 的 统计 技术 ,利用 新 的 400 个 学 生 样 本 的 高 中 GPA 
(已 经 从 之 前 的 学 生 数 据 集 了 解 高 中 GPA 与 大 学 第 一 年 的 GPA 有 关系 ) 估 
计 大 学 第 一 年 的 GPA。 很 好 用 ,对 吧 ? 

这 儿 还 有 男 一 个 案例 。 一 些 教师 对 留级 发 挥 的 作用 感 兴 趣 。 也 就 是 
一 些 孩 子 留 在 幼儿 园 ( 没 有 进入 一 年 级 ) 是 否 比 进入 一 年 级 更 好 ? 这 些 教 
师 知道 留级 和 一 年 级 的 成 绩 的 相关 系数 ;他 们 可 以 将 相关 系数 应 用 到 新 的 
学 生 样 本 并 依据 幼儿 园 的 成 绩 估计 一 年 级 的 成 绩 。 这 样 行 得 通 吗 ? 很 容 
易 。 收 集 过 去 事件 (如 两 个 变量 之 间 现 存 的 关系 ) 的 数据 ,然后 在 只 知道 
一 个 变量 的 情况 下 应 用 到 未 来 的 事件 中 。 这 要 上 比 你 想象 的 容易 。 
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本 章 的 内 容 就 是 详细 了 解 线性 回归 过 程 以 便 通过 和 值 估 计 了 值 。 我 
们 从 估计 的 一 般 逻 辑 的 讨论 开始 ,接着 评述 一 些 简单 的 绘制 线性 图 的 技 
能 ,最 后 以 具体 的 案例 讨论 估计 过 程 。 


估计 的 逻辑 


在 开始 实际 的 计算 并 展示 如 何 使 用 相关 进行 估计 之 前 ,我 们 先 讨 论 为 
什么 以 及 如 何 估 计 。 接 着 我 们 继续 使 用 以 高 中 GPA 估计 大 学 GPA 的 案例 。 
佑 计 是 以 过 去 的 结果 估计 未 来 结果 的 活动 。 当 我 们 想 通 过 一 个 变量 
佑 计 另 一 个 变量 ,我 们 首先 需要 计算 两 个 变量 之 间 的 相关 系数 。 表 14.1 
给 出 这 个 案例 中 使 用 的 数据 。 图 14. 1 是 将 要 计算 的 两 个 变量 的 散 点 图 


( 见 第 5 章 )。 

表 14.1 高 中 GPA 和 大 学 第 一 年 CPA 相关 

高 中 CPA 大 学 第 一 年 CPA 
3.50 3.30 
2.50 | 2.20 
4.00 3.50 
3.80 2.70 
2.80 3.50 
1.90 2.00 
3.20 3.10 
3.70 2223.40 
2.70 1.90 


3.30 3.70 


要 以 高 中 GPA 估计 大 学 GPA ,我 们 必须 建立 回归 等 式 ( regression 
equation ) ,并 使 用 这 个 等 式 建立 回归 线 (regression line) 。 回 归 线 反映 我 们 
以 变量 的 值 (高 中 GPA ) 估 计 变 量 Y 值 (大 学 GPA) 的 最 好 猜测 。 对 表 
14.1 中 所 示 的 所 有 数据 来 说 ,回归 线 使 得 回归 线 和 被 估计 变量 了 的 数据 
点 之 间 的 距离 最 小 化 。 你 会 很 快 学 会 如 何 绘制 图 14.2 所 示 的 回归 线 。 回 
归 线 表示 什么 ? 
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4.0 


2,5 


м 
© 


大 学 GPA (Y) 
N 


2.0 





1.5 2.0 2.5 3.0 3.5 4.0 


高 中 GPA (X) 


14.1 高 中 GPA 与 大 学 GPA 的 散 点 图 


4.0 


大 学 GPA (Y) 


р 
іл 


үл ХІНІШІҢ 


2.0 





1.5 2.0 2.5 3.0 3.5 4.0 


高 中 СРА (Х) 


14.2 大 学 GPA 对 高 中 GPA 的 回归 线 
首先 这 是 变量 了 对 变量 X 的 回归 。 换 句 话说 ,Y( 大 学 GPA ) 将 依据 处 
(高 中 GPA ) 被 估计 。 回 归 线 也 叫做 最 优 拟 合 线 (line of best fit) ІНІҢ 
最 好 地 拟 合 了 数据 ,因为 这 条 线 将 每 个 数据 点 与 回归 线 的 距离 最 小 化 。 例 
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如 ,你 考虑 所 有 的 数据 点 并 尽量 寻找 可 以 同时 拟 合 这 些 数据 点 的 直线 ,你 
会 看 到 图 14.2 中 所 示 的 直线 就 是 你 要 用 到 的 直线 。 

其 次 ,这 条 直线 可 以 用 于 进行 最 好 的 猜测 (已 知 高 中 GPA 的 情况 下 对 
大 学 GPA 进行 估计 ) 。 例 如 ,如果 高 中 GPA 是 3.0 ,那么 大 学 GPA 就 大 概 
( 记 住 ,这 只 是 看 图 示 大 概 估计 ) 是 2.8。 看 图 14.3 你 就 会 了 解 我 们 是 怎 
么 估计 的 。 我 们 先 在 x 轴 定 位 估计 值 (3.0) ,然后 绘制 从 x 轴 到 回归 线 的 
垂直 线 ,接着 绘制 水 平 线 到 y 轴 并 估计 对 应 值 的 大 小 。 


4.0 


3:5 


给 定 Х-3.0, {ӨТҮ 


大 学 GPA (Y) 


2.5 


2.0 





1.5 2.0 2.5 3.0 3.5 4.0 


高 中 СРА (X) 


14.3 ”给 定 高 中 GPA 估计 大 学 CPA 

第 三 ,每 一 个 具体 数据 点 和 回归 线 的 距离 就 是 估计 误差 (error іп pre- 
diction) 是 两 个 变量 之 间 相 关 的 直接 反映 。 例 如 ,你 看 到 的 数据 点 
3.3,3.7( 图 14.4 中 所 示 ) ,这 是 在 回归 线 上 方 的 X, 了 数据 点 。 这 个 数据 
点 和 回归 线 的 距离 就 是 估计 误差 ,就 如 图 14.4 中 所 标注 的 一 样 。 那 么 如 
果 是 完全 估计 ,所 有 估计 的 数据 点 会 落 在 什么 位 置 ? 刚好 就 在 回归 线 或 估 
计 线 之 上 。 

第 四 ,如 果 是 完全 相关 ,所 有 的 数据 点 将 沿 着 45° 角 成 为 一 条 直线 ,而 
且 回 归 线 通过 每 一 个 数据 点 (就 如 上 面 的 第 三 点 所 讲 ) 。 

给 定 回归 线 之 后 ,我 们 可 以 使 用 回归 线 估 计 任 何 未 来 的 值 。 这 正 是 我 
们 要 做 的 一 一 建立 回归 线 然后 进行 估计 。 
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4.0 






3:9 * 





X=3.3, Ү-37 —— Же 估计 误差 
' 
I 


3.0 


大 学 GPA (Y) 


2.5 


2.0 


1.5 2.0 2.5 3.0 3.5 4.0 


高 中 СРА (Х) 


图 14.4 估计 很 少 是 完全 估计 :估计 误差 


绘制 拟 合 数据 的 最 优 直线 


理解 估计 的 最 简单 的 方式 就 是 依据 一 个 变量 值 (我 们 称 为 X 一 一 独立 
变量 ,independent variable 或 估计 变量 ,predictor ) 确定 男 一 个 变量 的 值 (我 
们 称 为 了 Y 一 一 依赖 变量 ,dependent variable 或 标准 变量 ,criterion ) 。 

我 们 发 现 很 好 的 利用 开 估 计 工 的 方式 就 是 建立 本 章 之 前 提 到 的 回归 
线 。 回 归 线 依据 我 们 已 经 收集 的 数据 建立 。 接 着 利用 等 式 以 X 或 估计 变 
量 的 新 的 数值 进行 估计 。 

公式 14.1 所 示 是 回归 线 的 一 般 公 式 , 这 个 公式 在 高 中 或 者 大 学 的 数 
学 课程 中 都 可 能 用 到 ,对 你 来 说 应 该 很 熟悉 。 这 个 公式 与 其 他 任何 直线 公 
式 一 样 。 

Y= bX +a (14.1) 


其 中 
уже ХАН У ЖИБЕ 

b 表示 直线 的 斜率 或 者 方向 。 

a 表示 直线 与 y 轴 相 交 的 点 。 

七 表示 用 于 估计 的 数值 。 

现在 我 们 使 用 之 前 表 14. 1 中 列 出 的 相同 数据 进行 一 些 必 要 的 计算 。 


\ 
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Х ү y ү? ХЕТ 
229), 220 12258; 40:89 “H SS 
2:50 x 2.20 6.25 4.84 5.50 
4.00 3.580 16.00 1225 14:00 
3.80 .. 270 14.44: Т 10% 
2.80 3.50 7,847 12.25 "әл 
1.90 2.00 3.61 4.00 3.80 
2,0 7.310 ом. 96 9.92 
370 240 13.69 1.6 12.58 
2.70 1.90 7.29 3.61 5.13 
530 270 1089584369. 12:24 

总 计 31.4 29.3 102.50 89.99 94,57 


之 下 或 所 有 无 值 的 总 和 是 31.4。 
了 或 所 有 了 值 的 总 和 是 29.3。 
> X° 或 每 个 X 值 的 平方 和 是 102.5。 
> Y° 或 每 个 Y 值 的 平方 和 是 89.99。 
之 YY 或 所 有 拒 值 和 了 值 乘 积 的 和 是 94.75。 
公式 14.2 用 于 计算 回归 线 的 斜率 ( 直线 公式 中 的 5): 
ХҮ-( УХУ Yn 
ы сна (14.2) 
在 公式 14.3 中 你 可 以 看 到 直线 斜率 的 计算 值 。 
p = 94.75 - Г(31.4 х29.3)/10] (14.3) 


102.5 - [ (31.4)2⁄10] 


2.748 
b = 704 
公式 14.4 用 于 计算 直线 与 y 轴 相交 的 点 ( 直线 公式 中 的 а): 
а= РУ жыр. (14.4) 


在 公式 14.5 中 你 可 以 看 到 直线 截 距 a 的 计算 值 。 
a =29:3 = G. T04 x31.4) (14.5) 


7.19 
àG = 10 = ..719 


现在 回 到 直线 的 等 式 (Y' = bX +a) 并 代入 具体 的 a 值 和 4 值 ,最 后 的 
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回归 直线 就 表示 为 : 
Y' =.704Х +. 719 


为 什么 是 Y RRE Y?- 记 住 ,我 们 用 羡 估 计 Y,Y'( 读 作 Y 撤 ) 是 估 
计 值 而 不 是 实际 的 Y 值 。 现 在 我 们 已 经 建立 了 等 式 , 接 下 来 我 们 能 做 什 
Z? 估计 了 ,还 有 其 他 吗 ? 

例如 ,我 们 可 以 说 高 中 GPA 等 于 2.8( 或 X=2.8) ,如 果 我 们 将 2.8 这 
个 值 带 人 等 式 , 就 会 得 到 下 面 的 公式 : 


Y’ -.704(2.8) +.719 = 2.69 


因此 2. 69 就 是 等 于 2.8 BJ Y {АТН (нй Ү')„ РУХА X 
值 我 们 可 以 很 容易 地 快速 计算 Y 的 估计 值 。 


能 是 曲线 ,就 如 我 们 在 第 5 章 讨论 的 ,变量 间 的 关系 是 曲线 关系 。 
例如 焦虑 和 成 绩 之 间 的 关系 就 是 曲线 关系 ,也 就 是 当 人 们 完全 不 
焦虑 或 者 非常 焦虑 时 ,他 们 的 成 绩 都 不 好 。 只 有 他 们 的 焦虑 适度 ， 
成 绩 才 能 最 大 化 。 这 两 个 变量 之 间 的 关系 就 是 曲线 关系 ,所 以 在 
以 X 值 估计 了 值 时 要 考虑 。 


š 3 并 不 是 所 有 的 最 优 拟 合 数据 点 的 回归 线 都 是 直线 。 回 归 线 可 
Ao 
() 


我 们 的 估计 有 多 好 


如何 测量 我 们 依据 一 个 结果 估计 另 一 个 结果 的 工作 完成 的 好 坏 ? 我 
们 知道 两 个 变量 之 间 的 相关 系数 的 绝对 值 越 大 就 越 能 很 好 地 进行 估计 。 
理论 上 说 这 很 好 。 但 是 就 实际 估计 而 言 ,在 我 们 首次 计算 回归 线 的 公式 时 
我 们 也 能 够 看 到 估计 值 (YY ) 和 实际 值 (7) 之 间 的 差异 。 

例如 ,如 果 回 归 线 的 公式 是 -.704(2.8) +.719 , 工 值 为 2.8 的 了 的 
估计 值 () 是 .704(2.8) +.719 或 2.69。 我们 知道 对 应 X 值 的 实际 Y 值 
是 3.5( 见 表 14.1 所 示 的 数据 集 ) 3.5 与 2.69 之 间 相 差 . 81 ,也 就 是 我 们 
所 知道 的 估计 误差 (error of estimate ) 。 

如 果 我 们 考虑 所 有 的 偏差 ,我 们 可 以 计算 每 一 个 数据 点 偏离 于 估计 的 
数据 点 的 平均 数量 , 即 标准 估计 误差 (standard error of estimate ) 。 这 个 值 
告诉 我 们 估计 的 不 准确 性 程度 。 就 如 你 可 以 想到 的 ,两 个 值 之 间 相 关 程 度 
越 高 (估计 也 越 好 ) ,估计 误差 就 越 小 。 实 际 上 ,如果 两 个 变量 之 间 完 全 相 
关 ( +1 或 -1) ,标准 估计 误差 就 是 0。 为 什么 ? 因为 是 完全 估计 ,所 有 的 
实际 数据 点 都 落 在 回归 线 上 ,以 估计 Y 的 过 程 中 没有 误差 。 
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`1, 
КОд 
使 用 计算 机 计算 回归 线 


我 们 可 以 使 用 SPSS 在 以 XX 估计 了 的 过 程 中 计算 回归 线 。 我 
们 使 用 的 数据 集 是 第 14 章 数据 集 1 (Chapter 14 data 1) 。 我 们 以 训 
练 的 时 间 估 计 踢 足球 过 程 中 受伤 的 程度 。 
下 面 就 是 数据 集中 的 两 个 变量 : 
变量 定义 
训练 (training) ( X) 每 星期 力量 训练 的 小 时 数 
受伤 (injureis) ( Y) 以 1-10 为 测量 等 级 的 受伤 程度 








下 面 给 出 计算 本 章 讨论 的 回归 线 的 步骤 。 按照 这 个 顺序 实际 操作 。 
1. 打开 数据 文件 第 14 章 数 据 集 1 。 
` 2. 点 击 Analyze—Regression—Linear, 你 就 会 看 如 图 14.5 所 示 的 Lin- 
ear Regression 对 话 框 





图 14.5 线性 回归 对 话 框 
3. 点 击 变量 injureis , 然后 点 击 呈 将 选中 的 变量 移 到 | Dependent Varia- 
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bles 框 中 。 这 个 变量 是 依赖 变量 ,因为 它 的 值 依 赖 训 练 的 时 间 。 这 个 变量 
也 是 被 估计 的 变量 。 

4. 点 击 变量 training ,然后 点 击 旺 将 选中 的 变量 移 到 Independent Varia- 
ble 框 中 。 

5. 点 击 OK ,你 会 看 到 如 图 14.6 所 示 的 部 分 分 析 结 果 。 


Coefficients? 


Unstandardized Standardized 
Coefficients Coefficients 
— 5 [= вә __ 


onstant 6.847 1.00 6.818 .000 
TRAINING —.125 046 -.458 -2.727 011 


а. Dependent variable: injuries 





14.6 SPSS 分 析 结 果 


待 会 儿 我 们 会 解释 输出 结果 。 首 先 , 我 们 应 用 SPSS 在 这 些 数据 的 散 
点 图 上 绘制 回归 线 ,就 如 在 图 14.2 中 所 看 到 的 一 样 。 

6. 点 击 Graphs 一 >Scatter. 

7. 点 击 Simple ,然后 点 击 Define ,你 会 看 到 Simple Scatterplot 对 话 框 。 

8. 点 击 变量 injuries ,然后 点 击 P> 将 选中 的 变量 移 到 y-axis 框 中 。 记 住 
у 轴 表 示 被 估计 的 变量 。 

9. 点 击 变量 training ,然后 点 击 呈 将 选中 的 变量 移 到 x-axis 框 中 。 

10. 点 击 OK ,你 会 看 到 如 图 14.7 所 示 的 散 点 图 。 


10 
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TRAININC 


14.7 使 用 SPSS 建立 的 散 点 图 
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现在 绘制 回归 线 。 

1. 双击 散 点 图 , 选 定之 后 进行 编辑 。 

2. 点 击 Chart 一 Options ,你 就 会 看 到 Scatterplot Options 对 话 框 。 
3. 在 Fit Line 区 域 点 击 Total, 

4. 点 击 OK ,附带 回归 线 的 散 点 图 如 图 14. 8 所 示 。 
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TRAINING 
图 14.8 附带 回归 线 的 散 点 图 
SPSS 输出 结果 的 含义 


SPSS 的 输出 结果 可 以 告诉 我 们 几 点 。 首 先 ,回归 线 的 公式 依据 图 
14.6 所 示 的 输出 结果 设 定 , 是 Y= -125X +6.847。 这 个 等 式 可 以 在 给 定 
力量 训练 的 小 时 数 的 情况 下 估计 受伤 程度 。 实 际 上 ,就 如 在 图 14.8 中 能 
看 到 的 ,回归 线 的 斜率 是 负 值 ,也 反映 出 训练 时 间 和 受伤 程度 之 间 负 相关 
( 一 .458)。 因 此 ,依据 现在 给 出 的 数据 ,结果 就 是 训练 时 间 越 多 受伤 就 越 
轻微 。 


INJURIES 





估计 变量 越 多 就 越 好 ? 也 许 是 …… 


本 章 我 们 使 用 的 所 有 案例 都 是 一 个 结果 变量 和 一 个 估计 变量 。 有 些 
情况 下 回归 使 用 不 止 一 个 估计 变量 或 独立 变量 估计 一 个 特定 的 结果 。 如 
采 一 个 变量 能 够 以 一 定 的 准确 性 估计 一 个 结果 ,那么 两 个 变量 是 否 能 更 好 
地 估计 ? 

例如 ,如 果 高 中 GPA 是 大 学 GPA 很 好 的 指示 器 ,那么 高 中 GPA 加 上 
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课外 活动 数量 呢 ? 回归 模型 从 Y’ = bX +a ZÆ Y’ = bX, +bX, жа, 
其 中 

X, 表示 第 一 个 独立 变量 的 数值 

Х, 表示 第 二 个 独立 变量 的 数值 

b 表示 特定 变量 的 回归 权重 

与 你 猜测 的 一 样 , 这 个 模型 就 是 多 元 回归 ( multiple regression), [Ж 
此 ,在 理论 上 说 就 是 以 两 个 独立 变量 而 不 是 一 个 来 估计 结果 。 但 是 只 有 在 
某 些 条 件 下 你 才 会 想 增加 另外 的 独立 变量 。 

首先 ,你 增加 的 任何 变量 对 于 理解 依赖 变量 有 独特 的 贡献 。 否 则 为 什 
么 使 用 ? 我 们 所 说 的 独特 是 什么 含义 ? 附加 变量 需要 解释 第 一 个 估计 变 
量 不 能 解释 的 被 估计 的 变量 的 差异 。 也 就 是 说 这 两 个 变量 综合 起 来 可 以 
比 任何 一 个 变量 单独 估计 更 好 地 估计 Yo 

在 我 们 的 案例 中 ,参与 课外 活动 的 水 平 可 以 做 出 独特 的 贡献 。 那 我 们 
是 否 可 以 增加 一 个 变量 如 每 个 高 中 生 的 学 习 时 间作 为 第 三 个 独立 变量 或 估 
计 变 量 ? 因为 学 习 时 间 与 CPA( 我 们 的 另 一 个 估计 变量 ) 的 相关 程度 很 高 ， 
所 以 学 习 时 间 对 于 估计 大 学 GPA 不 能 提供 更 多 信息 。 因 此 寻找 另外 的 变量 
(例如 推荐 信 的 级 别 ) 可 能 比 花 费时 间 收 集 学 习 时 间 的 数据 更 为 有 效 。 


使 用 多 元 估计 变量 应 遵守 的 重要 原则 


如 果 要 使 用 不 止 一 个 估计 变量 ,要 谭 记 遵守 下 面 的 两 项 重要 的 原则 : 

1. 如 果 选 择 一 个 独立 变量 估计 一 个 结果 ,要 选择 与 被 估计 变量 (Y) 相关 
的 估计 变量 (X) 。 也 就 是 这 两 个 变量 有 共 变 的 部 分 ( 记 住 ,它们 应 该 相关 ) 。 

2. 如 果 选 择 不 止 一 个 独立 变量 或 估计 变量 (如 Xm 与 Xm) ,要 尽量 选 
择 相互 独立 或 者 不 相关 的 变量 ,但 是 都 要 与 结果 变量 或 被 估计 变量 (了 ) 
相关 。 

实际 上 ,你 只 想 要 独立 变量 或 估计 变量 与 依赖 变量 相关 ,而 彼此 不 相 
关 。 也 就 是 每 个 独立 变量 尽 可 能 在 估计 依赖 变量 或 被 估计 变量 时 做 出 独 
特 的 贡献 。 


Р 多 少 估计 变量 会 嫌 多 ? 如 果 一 个 变量 可 以 估计 结果 ,而 且 两 
45» 个 变量 就 会 更 准确 ,那么 为 什么 不 选 3 个 ,4 个 或 5 个 估计 变量 ? 
() 就 实际 操作 而 言 ,每 增加 一 个 变量 就 相应 增加 费用 。 一 些 人 必须 
| 去 收集 数据 ,这 就 要 花费 时 间 ( 就 研究 预算 而 言 就 要 有 很 大 的 花 
费 ) ,等 等 。 就 理论 上 而 言 , 使 用 多 少 变量 可 以 有 助 于 理解 我 们 要 
估计 的 结果 有 硬性 的 限制 。 问 题 是 一 旦 你 选择 了 3 个 或 4 个 变 
量 , 变 量 之 间 很 少 不 相 关 。 准 确保 守 的 估计 比 包 含 太 多 变量 浪费 
太 多 资金 和 功效 的 估计 更 有 优势 。 
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к ааа ала тата аа ааа ы-і 
小 结 
估计 是 简单 相关 系数 的 特殊 应 用 ,而 且 是 检验 复杂 关系 的 非常 有 力 的 工具 。 
这 可 能 使 得 本 章 比 其 他 各 章 要 难 一 些 , 但 是 你 会 受益 于 你 的 所 学 ,特别 是 当 你 能 
够 将 此 应 用 到 你 所 阅读 的 研究 报告 和 期 刊 文章 中 时 。 随 着 有 关 推 论 统 计 的 大 多 
数 章节 的 结束 ,我 们 可 以 进一步 将 统计 技术 应 用 到 样本 规模 非常 小 或 者 假定 其 
数据 分 布 不 是 正 态 分 布 的 样本 中 。 


| 练习 时 间 

1. 第 14 章 数 据 集 2(chapter 14 data 2) 是 一 个 群体 参与 定时 测试 的 数据 。 数 
据 是 参与 者 完成 每 一 个 项 目的 平均 时 间 ( 反 应 时 间 ) ,以 及 项 目 正确 的 数量 (正确 
数量 )。 

a. 给 出 依据 正确 数量 估计 反应 时 间 的 回归 等 式 。 

b. 如 果 正 确 数量 是 8, 估 计 反 应 时 间 。 

с. 对 每 一 个 估计 的 反应 时 间 来 说 实际 的 正确 数量 和 估计 的 正确 数量 之 间 的 
偏差 是 多 少 ? 

2. 贝 特 斯 对 估计 有 多 少 75 岁 的 老人 会 患 老年 痴呆 病 感 兴趣 ,并 以 教育 水 平 
和 10 级 测量 的 一 般 健 康 状况 作为 估计 变量 。 但 她 也 对 其 他 估计 变量 感 兴 趣 。 
回答 下 面 的 问题 。 

а. 在 选择 其 他 估计 变量 时 应 遵守 什么 标准 ,为 什么 ? 

b. 定义 其 他 两 个 可 能 与 老年 痴呆 病 发 病 相 关 的 估计 变量 。 

с. 如 果 选 择 四 个 估计 变量 (教育 水 平 、 一 般 健 康 状况 以 及 你 定义 的 两 个 新 的 
变量 ) ,给 出 可 能 的 回归 等 式 。 

3. 去 图 书馆 ,在 你 感 兴趣 的 领域 的 研究 中 选择 三 个 不 同 的 线性 回归 的 案例 。 
如 果 研 究 包含 不 止 一 个 估计 变量 也 可 以 。 对 应 每 个 研究 回答 问题 。 

a. 哪 一 个 是 独立 变量 , 哪 一 个 是 依赖 变量 ? 

b. 如 果 有 不 止 一 个 独立 变量 ,关于 变量 之 间 是 否 相互 独立 研究 者 进行 了 怎 
样 的 讨论 ? 

c. 三 个 研究 中 哪 一 个 提供 的 表明 依赖 变量 是 依据 独立 变量 进行 估计 的 证 据 
最 少 ,为 什么 ? 

4. 现在 应 用 本 章 提供 的 信息 并 获得 预测 超级 杯 胜 利 者 的 机 会 。 乔 教练 非常 
想 知道 一 年 中 比赛 胜利 的 平均 次 数 是 否 可 以 预测 超级 杯 的 成 绩 (胜利 或 失败 )。 
变量 下 是 在 过 去 10 个 赛季 赛事 胜利 的 平均 次 数 。 变 量 了 是 过 去 十 个 赛季 某 个 
队 是 否 获得 超级 杯 。 下 面 就 是 给 出 的 数据 : 


14 жлевивият-еЖЕМШІН 181 


队伍 过 去 十 年 赛事 胜利 的 是 否 赢 得 超级 杯 

平均 次 数 (1= 是 ,0= 否 ) 
Savannah sharks 12 1 
Pittsburgh pelicans 11 0 
Williamstown 15 0 
Bennington bruisers 12 1 
Atlanta angels 13 1 
Trenton terrors 16 0 
Virginia vipers 25 1 
Charleston crooners 9 0 
Harrisburg heathens 8 0 
Eaton energizers 12 1 


а. 如 何 评价 赛事 胜利 的 平均 次 数 作为 队伍 是 否 赢得 超级 杯 的 估计 变量 的 有 效 性 ? 
b. 使 用 分 类 变量 (如 1 或 0) 作 为 依赖 变量 的 优点 是 什么 ? 
с. 其 他 的 可 用 于 估计 依赖 变量 的 变量 有 哪些 ? 为 什么 选择 这 些 变 量 ? 


练习 参考 答案 

la. 回归 等 式 是 Y= -.214( 正 确 的 数量 ) + 17. 202 

lb. У' = -.214(8) +17.202 =15.49。 

1с. 

时 间 ( 了 ) 正确 数量 (XX) к ү-Ү 

14.5 5 16.13 -1.63 
13.4 7 15.70 -2.30 
12.7 6 15.92 -p 
16.4 2 16.77 -0.37 
21.0 4 16.35 4.65 
13.9 3 16.56 -2.66 
17.3 12 14.63 2.67 
12.5 5 16.13 -3.63 
16.7 4 16.35 0.35 
22.7 3 16.56 6.14 


2а. 其 他 的 估计 变量 不 能 和 任何 一 个 估计 变量 相关 。 只 有 这 些 变量 相互 独 
立 才 能 够 在 估计 依赖 变量 或 结果 变量 时 提供 独特 的 贡献 。 

2b. 例如 ,生活 安排 (单独 过 或 者 与 他 人 一 起 生活 ) 和 获得 医疗 服务 的 机 会 
(高 、 中 和 低 )。 

2с. ЕЖЕЛ = (教育 水 平 )Xm + (С ЖЕЖ У) Хь + (生活 安 
排 )Xm + (获得 医疗 服务 的 机 会 )Xm +a, 

3. 自己 来 完成 。 

4а. 计算 这 两 个 变量 之 间 的 相关 系数 ,是 .204。 依 据 第 5 章 的 信息 ,这 样 的 
相关 系数 值 比 较 低 。 你 可 以 得 出 的 结论 是 胜利 次 数 不 是 队伍 是 否 赢 得 超级 杯 的 
很 好 的 估计 变量 。 

4b. 许多 变量 依据 属性 特征 (性 别 、 种 族 、 社 会 阶级 和 党 派 ) 分 类 ,并 且 很 难 依 
据 类 似 1 ~100 的 等 级 进行 测量 。 使 用 分 类 变量 可 以 给 我 们 很 大 的 弹性 空间 。 

4с. 其 他 的 变量 可 能 是 全 美 球员 的 数量 教练 的 输 / 赢 记录 和 家 庭 护理 。 


非 正 态 分 布 时 做 什么 15 
一 一 卡 方 和 其 他 非 参 数 检验 


本 章 你 会 学 到 什么 
* 非 参 数 统计 的 简要 介绍 以 及 何 时 、 如 何 使 用 非 参数 统计 





非 参 数 统计 的 介绍 


到 现在 为 止 我 们 在 4 爱 上 统计 学 》 这 本 书 中 介绍 的 每 一 种 统计 检验 方 
法 几乎 都 假定 你 所 使 用 的 数据 集 都 有 确定 的 特征 。 例 如 ,支持 均值 (独立 
均值 与 不 独立 均值 ) 之 间 上 检验 的 一 个 假定 就 是 每 个 群体 的 方差 是 齐 性 
的 ,或 者 是 类 似 的 。 而 且 这 项 假定 可 以 检验 。 大 多 参数 统计 (Parametric 
statistics) 的 另 一 项 假定 是 样本 要 大 到 足以 代表 总 体 。 统 计 学 家 已 经 发 现 
样本 规模 达到 30 就 可 以 满足 这 项 假定 。 到 现在 我 们 已 经 学 过 的 许多 统计 
检验 都 是 稳健 的 或 者 强 有 力 的 ,即使 这 些 假定 之 一 已 经 不 成 立 但 是 检验 仍 
然 有 效 。 

但 如 果 上 述 假定 都 不 成 立 你 将 怎么 做 ? 最初 的 研究 问题 肯定 只 得 继 
续 提 出 并 回答 。 这 就 是 我 们 使 用 非 参 数 统计 (nonparametric statistics ,也 叫 
做 自由 分 布 统计 ) 的 时 候 。 这 些 统计 检验 方法 不 遵循 相同 的 “规则 ”( 也 就 
是 不 需要 和 我 们 已 经 评述 的 参数 检验 一 样 的 假定 ) ,可 也 同样 很 有 价值 。 
非 参 数 检验 的 使 用 还 可 以 让 我 们 分 析 频 数 数 据 ,例如 不 同年 级 的 学 生 数 量 
或 得 到 社会 保障 的 人 口 比 例 。 

例如 ,如果 你 想 知 道 最 近 的 选举 中 赞同 教育 券 的 投票 人 数 是 否 符 合 你 
的 随机 预测 ,或 者 是 否 真 的 存在 偏好 模型 ,那么 我 们 就 使 用 非 参数 统计 也 
就 是 卡 方 检 验 。 

在 这 一 章 我 们 介绍 卡 方 检验 一 一 最 常用 的 非 参 数 检验 之 一 ,还 要 简要 
地 介绍 其 他 非 参 数 检验 方法 ,这 样 你 就 会 对 可 以 用 到 的 一 些 非 参数 检验 方 
法 有 一 定 的 了 解 。 
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单 样本 卡 方 检验 介绍 


卡 方 是 很 好 的 非 参 数 检验 方法 ,可 以 用 于 确定 你 在 频数 分 布 中 观察 到 
的 结果 是 否 就 是 你 随机 预期 的 结果 。 单 样本 卡 方 只 包括 一 维 ,就 如 你 在 这 
里 看 到 的 案例 。 双 样本 卡 方 检验 包括 两 个 维度 ,例如 赞同 教育 券 是 否 独立 
于 政党 背景 和 性 别 。 

例如 ,这 里 的 数据 是 随机 选 自 加 州 索 诺 玛 郡 1990 年 人 口 调查 的 一 个 
样本 数据 。 就 如 你 所 看 到 的 ,这 个 表 以 不 同 教育 水 平 划分 数据 。 


教育 水 平 
没有 上 大 学 上 了 大 学 获得 学 位 总 计 
25 42 17 84 


这 里 的 问题 是 回答 者 的 数量 是 否 在 各 个 教育 水 平等 量 的 分 布 。 要 回 
答 这 个 问题 就 要 计算 卡 方 值 并 进行 显著 性 检验 。 在 这 个 案例 中 , 卡 方 值 等 
于 11.643 ,这 个 值 在 .05 显著 水 平 下 是 显著 的 。 结 论 就 是 这 个 案例 中 回答 
者 在 不 同 教 育 水 平 的 分 布 不 是 等 量 的 分 布 。 换 句 话 说 ,这 不 是 我 们 随机 预 
期 的 结果 。 

单 样 本 卡 方 检验 的 原理 是 ,就 任何 事件 的 发 生 而 言 都 可 以 很 容易 地 计 
算 随 机 预期 的 结果 。 你 可 以 通过 事件 总 体 发 生 的 数量 除 以 层级 或 者 分 类 
的 数量 实现 。 在 我 们 的 人 口 调查 样本 中 ,观察 到 的 事件 发 生 的 总 的 数量 是 
84。 我 们 随机 预期 84/3 或 28 个 (频数 的 总 和 84 除 以 分 类 的 总 数 3) 回答 
者 分 别 落 在 教育 水 平 的 三 个 分 类 中 。 

现在 我 们 来 看 我 们 随机 预期 的 数量 和 实际 观察 的 数量 的 差异 程度 。 
如 果 预 期 的 数量 和 实际 观察 的 数量 没有 区 别 , 卡 方 值 就 等 于 0。 

接 下 来 让 我 们 具体 地 了 解 如 何 计算 卡 方 值 。 


计算 卡 方 检验 统计 量 
卡 方 检验 要 进行 观察 值 和 随机 预期 值 的 比较 。 公 式 15. 1 就 是 单 样本 
卡 方 检验 的 卡 方 值 计算 公式 。 
ж? ЕР Ж (0 -Ey (15. 1) 
其 中 
х 表示 卡 方 值 
> 是 连 加 符号 


О 表示 观察 频数 
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Фаза, 爱 上 统计 学 
五 表示 预期 频数 | 
下 面 是 我 们 用 于 计算 卡 方 值 的 数据 。 
对 教育 券 的 态度 
赞同 中 立 反对 总 计 
23 17 50 9% 


下 面 是 检验 这 个 统计 量 的 著名 的 八 个 步骤 。 | 
І. 零 假 设 和 研究 假设 的 表述 。 公 式 15.2 所 示 就 是 零 假 设 , 表 示 每 一 
分 类 内 事件 发 生 的 频数 或 比例 没有 差异 。 
Н. Fls РЬ = Р, (15.2) 


零 假 设 中 了 表示 每 一 分 类 中 事件 发 生 的 百分比 。 零 假设 表示 分 类 1 
(赞同 ) ,分 类 2( 中立 ) 和 分 类 3( 反 对 ) 中 个 案 所 占 的 百分比 相等 。 我 们 只 
使 用 三 个 分 类 ,如 果 情 况 允 许 这 个 分 类 数字 可 以 扩展 ,只 要 这 些 分 类 相互 
排斥 ,也 就 是 任何 一 个 观察 值 只 能 落 在 一 个 分 类 中 。 例 如 ,你 不 能 同时 既 
是 男性 又 是 女性 。 当 然 你 也 不 能 同时 既 赞 同 又 反对 教育 券 。 

公式 15.3 所 示 就 是 研究 假设 ,表示 每 个 分 类 中 事件 发 生 的 频数 或 百 
分 比 不 同 。 

Н,: P, # P, зж Р, (15.3) 

2. 设置 零 假 设 的 风险 水 平 ( 或 显著 性 水 平 , 或 第 一 类 错误 ) 。 第 一 类 
错误 设置 在 .05。 

3. 选择 合适 的 检验 统计 量 。 相 互 区 别 的 分 类 (例如 赞同 .中 立 和 反 
对 ) 的 频数 和 百分比 之 间 的 任何 检验 需要 使 用 卡 方 。 我 们 之 前 使 用 的 选 
择 统计 检验 类 型 的 流程 表 不 适合 非 参 数 检 验 过 程 。 

4. 计算 检验 统计 值 (也 叫做 实际 值 ) 。 现 在 回 到 之 前 关于 教育 券 案 例 
的 数据 并 建立 一 个 数据 表 用 于 帮助 我 们 计算 卡 方 值 。 


赞同 23 30 -7 49 1.63 
中 立 17 30 -13 169 5.63 
反对 50 30 20” 400 13.33 
总 计 90 90 


15 FERAHA Z— T >r fir Ж 185 





我 们 依据 下 面 的 步骤 准备 上 面 的 数据 表 。 

1 一 键入 各 个 分 类 ( Category) 一 一 赞同 .中 立 和 反对 。 要 记 住 这 三 个 
分 类 相互 排斥 。 任 何 数据 点 只 能 落 在 一 个 分 类 内 。 

2 一 键 人 观察 频数 (O) ,表示 实际 收集 到 的 数据 。 

3 一 键入 预期 频数 (E) ,是 观察 到 的 频数 总 和 除 以 分 类 数量 (3 ) ,或 者 
90/3 -30. 

4 一 对 应 每 一 行 (D) ,就 是 观察 频数 减 去 预期 频数 。 以 预期 频数 减 去 观 
察 频 数 也 可 以 ,因为 这 个 值 在 下 一 步 中 将 进行 平方 。 | 

5 一 计算 观察 值 和 预期 值 差 的 平方 。 你 可 以 在 (0 - E)’ 一 栏 中 看 到 
这 些 值 。 

6 一 观察 值 和 预期 值 偏差 的 平方 除 以 预期 的 频数 。 你 可 以 在 (0 - 
E) /下 一 栏 中 看 到 这 些 值 。 

7 一 对 最 后 一 栏 求 和 ,你 就 会 得 到 总 的 卡 方 值 20. 6。 








5. 使 用 特定 统计 量 的 临界 值 分 布 表 确定 拒绝 零 假设 需要 的 值 。 现 在 
我 们 需要 查阅 附录 В 的 表 B5 , 表 В5 列 出 了 卡 方 检验 的 临界 值 。 

我 们 的 第 一 个 任务 是 确定 自由 度 (df) ,自由 度 近似 于 数据 表 中 的 分 类 
数量 。 对 现在 选 定 的 统计 检验 量 来 说 ,自由 度 是 -1, 其 中 7 等 于 行 数 ,或 
3--1::2; 

使 用 这 个 数字 (2)、 你 愿意 承担 的 风险 水 平 (之 前 定义 的 .05 ) ,你 可 以 
使 用 卡 方 分 布 表 查阅 临界 值 。 这 个 值 是 5.99。 因 此 ,在 显著 水 平 为 . 05、 
自由 度 为 2 的 情况 下 拒绝 零 假设 需要 的 值 是 5.99。 

6. 比较 实际 值 和 临界 值 。 实 际 值 是 20.6 ,拒绝 零 假设 也 就 是 在 分 类 
1,2 和 分 类 3 发 生 的 频数 相等 需要 的 临界 值 是 5.99。 

7. 和 8. 做 出 决定 。 现 在 我 们 该 做 出 决定 了 。 如 果实 际 值 大 于 临界 值 就 
不 能 接受 零 假 设 。 如 果实 际 值 没 有 超过 临界 值 , 零 假设 就 是 最 有 力 的 解释 。 
在 这 个 案例 中 ,实际 值 超过 临界 值 一 一 这 个 值 足 够 大 ,我 们 可 以 说 回答 者 在 
三 个 分 类 中 的 分 布 不 相等 。 实 际 上 人 们 对 教育 券 的 选择 上 ,赞成 .中 立 或 反 
对 的 频数 分 布 存 在 差异 。 


- A 单 样本 卡 方 检验 有 一 个 常用 的 名 称 是 拟 合 优 度 。 这 个 名 称 暗 
“6 含 的 问题 是 一 个 数据 集 * 拟 合 " 现存 的 数据 集 的 程度 。 当 然 这 个 现 


存 的 数据 “ 集 ” 就 是 观察 到 的 数据 。“ 拟 合意 味 着 存在 另 一 个 可 
以 匹配 观察 到 的 数据 的 数据 集 。 标 准 就 是 计算 x 值 的 过 程 中 计 
算 的 预期 数据 集 。 如 果 观 察 数 据 能 拟 合 ,就 是 观察 数据 和 随机 预 
期 数据 非常 接近 ,而 且 不 存在 显著 差异 。 如 果 观 察 数 据 不 能 拟 合 ， 
就 是 观察 到 的 数据 和 预期 的 数据 不 同 。 





16 42%?2% а, аны 


那么 如 何 解释 Xi -20.6,р <. 05 


。X 表示 检验 统计 量 。 

° 2 是 自由 度数 值 。 

e 20.6 是 实际 值 , 是 使 用 本 章 之 前 给 出 的 公式 计算 所 得 的 值 。 

e p <.05( 实 际 上 是 这 个 简短 表达 式 中 最 重要 的 部 分 ) 表 示 对 零 假 设 
的 任何 检验 来 说 ,投票 频数 在 各 个 分 类 中 随机 等 量 分 布 的 可 能 性 小 
于 5% ,因为 我 们 以 .05 作 为 研究 假设 比 零 假设 更 有 人 解释 力 的 标准 ， 
所 以 我 们 的 结论 就 是 两 个 数据 集 之 间 有 显著 差异 。 


使 用 计算 机 进行 卡 方 检验 
下 面 介 绍 如 何 应 用 SPSS 进行 简单 的 单 样本 卡 方 检验 。 我 们 
使 用 的 数据 集 名 称 是 第 15 章 数 据 集 1(chapter 15 data set 1) ,这 个 
数据 集 也 用 在 先前 的 教育 券 案 例 中 。 





1. 打开 数据 文件 。 对 于 单 样本 的 卡 方 检验 来 说 ,你 只 需要 在 
每 一 列 键入 发 生 的 数字 ,也 就 是 使 用 每 一 种 可 能 结果 的 不 同 数值 。 
在 这 个 案例 中 ,在 第 1 列 总 共有 90 个 数据 点 :键入 23 个 1( 赞 同 )， 
键 人 17 个 2( 中 立 ) ,键入 50 个 3( 反 对 )。 

2. 点 击 Analyze 一 Nonparamatric Tests 一 -Chi-Square ,你 就 会 看 到 
如 图 15.1 所 示 的 对 话 框 。 


` Chi-Square Test x| 











Test Variable List: 









Expected Values 
216 All categories equal 


С values: ЕУ 
бай | 
Спапде | 
Remove | 


15.1 卡 方 检验 对 话 框 
3. 双击 变量 voucher。 
4. 点 击 ОК. SPSS 执行 分 析 结 果 , 并 产生 如 图 15.2 所 示 的 


6 et from data 


‚ С Use specified range 


| Lower: 


Uppert: | 


Т Range 
| 






| 
| 








15 非 正 悉 分 市 肝 伐 什么 一 一 不 方 和 其 他 非 参 冻 栓 验 187 


Chi-Square Test 


Frequencies 


VOUCHER 


Test Statisties 


Chi-Squarea 
df 
Asymp. Sig. 
а. 0 cells (.0%) have expected frequencies less than 
5. The minimum expected cell frequency is 30.0. 





图 15.2 卡 方 分 析 的 SPSS 输出 结果 
SPSS 输出 结果 的 含义 


卡 方 检 验 的 SPSS 的 输出 结果 明确 给 出 我 们 之 前 已 经 讨论 的 内 容 。 我 
们 只 强调 和 我 们 的 分 析 相 关 的 结果 。 

1. 将 对 应 观察 出 现 频数 N 按照 具体 分 类 一 一 赞同 (编码 为 1) 中立 
(编码 为 2) 和 反对 (编码 为 3) 列 出 。 

2. 接着 按 分 类 列 出 预期 频数 N, 在 这 个 案例 中 是 90/3 ,或 30。 

3. 卡 方 值 是 20. 600 ,自由 度 在 输出 结果 的 Test Statistics( 检验 统计 量 ) 
部 分 中 给 出 。 

准确 的 显著 水 平 (在 图 中 的 名 称 是 Аѕутр. Sig. ) 太 小 (小 于 . 000) 所 以 
5Р55 以 . 000 计算 。 一 个 非常 不 可 能 的 结果 。 因 此 ,这 三 个 分 类 的 频数 相 
等 非常 不 可 能 。 


你 应 该 了 解 的 其 他 非 参 数 检 验 


你 可 能 永远 不 需要 非 参数 检验 来 回答 你 所 提出 的 研究 问题 。 但 是 ,你 
也 可 能 发 现 你 分 析 的 样本 非常 小 (至少 小 于 30) 或 者 数据 破坏 Тен 
检验 的 一 些 重要 的 假定 。 
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6 实际 上 ,你 想 使 用 非 参数 统计 的 最 初 原因 是 因为 你 所 研究 的 
2%; 变量 在 测量 方面 的 性 能 。 我 们 在 下 章 会 进行 更 多 的 讨论 ,但 是 就 
Е 现在 而 言 ,大 多 数 数据 是 分 类 的 或 者 是 放 在 不 同 的 分 类 中 的 (例如 
小 鱼 种 类 和 喷气 式 飞 机 的 种 类 ) ,或 者 是 定 序 或 等 级 排序 (如 第 1、 
第 2 和 第 3) 的 ,它们 都 需要 表 15.1 中 给 出 的 某 种 非 参 数 检验 。 
如 果 是 这 种 情况 ,可 以 依据 样本 规模 选择 非 参 数 统计 。 表 
15.1 给 出 了 你 需要 了 解 的 一 些 非 参数 检验 的 内 容 , 包 括 名 称 、 使 用 
目的 和 每 一 个 方法 应 用 的 研究 问题 。 要 记 住 的 是 这 个 表 中 只 给 出 
了 你 可 能 用 到 的 非常 不 同 的 众多 检验 方法 中 的 一 小 部 分 。 





小 结 
卡 方 检验 是 林林总总 的 非 参数 检验 中 的 一 种 ,可 以 帮助 你 回答 基于 破坏 了 
正 态 分 布 基本 假定 或 者 规模 太 小 的 数据 基础 上 的 问题 。 这 些 非 参 数 检验 是 非常 
有 价值 的 工具 ,即使 现在 提供 的 介绍 非常 有 限 , 你 还 是 会 得 到 一 些 帮 助 。 
表 15.1 分 析 分 类 和 定 序数 据 的 非 参数 检验 


检验 方法 名 称 何 时 使 用 研究 问题 示例 
分 析 分 类 数据 
检验 变化 显著 性 的 MeNemar 检验 变化 的 “前 和 后 ” ”” 打 电话 给 对 某 个 特定 问题 没有 做 出 
检验 投票 决定 的 候选 人 的 效果 如 何 ? 
Fisher 精确 检验 计算 2 хо 列 联 表 中 每 个 “投掷 6 枚 硬币 得 到 6 个 正面 的 准确 
结果 的 准确 概率 概率 ? 
单 样本 卡 方 检验 (就 是 本 章 讨 确定 不 同 分 类 的 事件 发 生 在 最 近 的 销售 中 品牌 Fruities、 
论 的 重点 ) 次 数 是 随机 分 布 的 Whammies 和 Zippes 的 销售 量 是 否 
相同 ? 
分 析 定 序数 据 
Kolmogorov-Smimov 检验 分 析 一 个 样本 的 数据 是 否 一 群 小 学 生 选 择 到 哪 一 所 小 学 去 的 
来 自 特定 的 总 体 判断 是 否 具有 代表 性 ? 
符号 检验 或 中 位 数 检验 用 于 比较 两 个 样本 的 中 投票 给 候选 人 A 的 群体 的 收入 中 
位 数 位 数 是 否 高 于 投票 给 候选 人 B 的 
群体 的 收入 中 位 数 ? 
Mann-WhitneyU 检验 用 于 比较 两 个 独立 样本 群体 A 是 否 比 群体 B 的 学 习 转移 
速度 快 ? 一 一 以 正确 数量 测量 
Wilcoxon 等 级 检验 比较 两 个 群体 的 差异 的 大 ”在 帮助 儿童 语言 技能 的 发 展 方面 学 
小 和 方向 前 教育 带 来 的 效果 是 否 是 没有 学 前 


教育 的 两 倍 ? 
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续 表 
检验 方法 名 称 何 时 使 用 研究 问题 示例 
Kruskal-wallis 一 元 方差 分 析 ”比较 两 个 或 多 个 独立 样本 ”四 个 地 区 办 公 室 管理 者 的 等 级 差异 
的 总 体 差异 如 何 ? 

弗 里 德 曼 ( Friedman) 二 元 方差 ”比较 两 个 或 多 个 独立 样本 ”四 个 地 区 办 公 室 管理 者 的 性 别 和 等 
分 析 在 不 止 一 个 维度 上 的 总 体 ” 级 差异 如 何 ? 2 
差异 
斯 皮尔 曼 ( Spearman) 等 级 相关 ”计算 等 级 相关 系数 高 中 最 后 一 年 的 名 次 和 大 学 第 一 年 
系数 的 名 次 之 间 的 相关 系数 是 多 少 ? 
练习 时 间 


1. 使 用 下 面 的 数据 检验 问题 一 一 最 近 的 选举 中 民主 党 、 共 和 党 和 无 党 派 人 
士 的 投票 人 数 相同 。 在 .05 的 显著 水 平 下 检验 假设 。 手 动 计算 。 


党 派 选 择 
共和 党 民主 党 无 党 派 人 士 
800 700 900 


2. 使 用 下 面 的 数据 在 .01 显著 水 平 下 检验 问题 一 一 男孩 和 女孩 参加 初级 足 
球 培 训 的 人 数 相 同 。( 可 以 从 第 15 章 数据 集 2 得 到 数据 。) 使 用 SPSS 或 其 他 统 
计 软 件 并 计算 卡 方 值 的 准确 概率 。 你 的 结论 是 什么 ? 
性 别 
B É к Ж 
45 55 


3. 下 面 的 四 个 研究 问题 哪 一 个 适合 卡 方 检验 ? 

a. 两 个 数学 班 的 平均 成 绩 的 差异 。 

b. 1 班 通过 数学 考试 的 人 数 和 2 班 通过 数学 考试 的 人 数 不 同 。 
ce. 今年 通过 碰撞 检验 的 汽车 数量 与 去 年 通过 的 数量 不 同 。 

d. 比较 橄榄 球 运 动员 与 足球 运动 员 的 100 码 跑 步 速 度 。 


练习 参考 答案 
1. 下 面 是 计算 卡 方 值 的 数据 表 。 
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分 类 0( 观 察 频数 ) E( 预 期 频数 ) D( 偏 差 ) (0-E)* (О-Е)?/Е 


共和 党 800 800 0 0 0. 00 
民主 党 700 800 100 10 000 12. 50 
民主 人 士 900 800 100 10 000 12. 50 


自由 度 为 2、 显著 水 平 为 .05 的 情况 下 拒绝 零 假 设 需 要 的 临界 值 是 5.99。 实 
际 值 是 25 表明 我 们 应 拒绝 零 假 设 ,而 且 我 们 得 出 的 结论 是 不 同 党 派 的 投票 人 数 
具有 显著 性 差异 。 
2. 下 面 是 计算 卡 方 值 的 数据 表 。 
分 类 0( 实 际 频数 ) ” E( 预 期 频数 ) D( 偏 差 ) (0-Е)" (О-Е)?/Е. 
男孩 45 50 5 25 0. 50 
女孩 44 50 5 25 0. 50 


自由 度 为 1、 显 着 水 平 为 .01 的 情况 下 拒绝 零 假 设 需 要 的 临界 值 是 6.64。 实 
际 值 是 1 表明 我 们 不 能 拒绝 零 假 设 , 也 就 是 跑 足 球 的 男孩 和 女孩 的 数量 没有 
差异 。 

3. 问题 b 和 c 适合 进行 卡 方 检 验 ,因为 收集 的 数据 的 属性 是 分 类 的 。 问 题 a 
和 d 处 理 的 数据 是 连续 数据 (如 平均 成 绩 和 跑步 速度 )。 


这 就 是 真相 
ТД ШӘ 





本 章 你 会 学 到 什么 


e 什么 是 信和 度 和 效 度 以 及 它们 为 什么 重要 

e 这 是 统计 课程 ,为 什么 要 学 习 测 量 的 内 容 ? 
e 基本 的 测量 尺度 

e 如 何 计 算 和 解释 不 同类 型 的 信 度 系数 

e 如 何 计 算 和 解释 不 同类 型 的 效 度 系 数 


信和 度 和 效 度 介绍 


社会 福利 (以 及 其 他 领域 ) 的 专家 认为 美国 50 多 万 寄养 儿童 的 存在 
是 个 严重 的 问题 。 主 要 问题 之 一 是 出 生 家 庭 仍 然 在 他 们 的 生活 中 扮演 重 
要 角色 的 情况 下 ,寄养 儿童 如 何 适 应 暂时 的 寄养 家 庭 。 

索尼 亚 . 丁 . 莱 瑟 斯 (Sonya J. Leathers ) 在 研究 亲生 父母 的 经 常 性 拜访 
与 寄养 儿童 对 寄养 家 庭 和 亲生 父母 的 忠诚 度 之 间 的 关系 时 考察 了 这 个 问 
题 。 在 199 个 青少年 样本 中 她 发 现 出 生 家 庭 的 经 常 性 拜访 的 确 带 来 了 冲 
ЖЖ ,她 建议 采取 一 些 有 助 于 减少 这 些 冲 突 的 干预 措 拖 。 

她 在 研究 中 使 用 了 许多 不 同 的 依赖 变量 (如 儿童 症状 量 表 和 访问 次 
数 )。 在 其 他 方面 ,她 做 的 正确 的 事 就 是 关注 测量 工具 的 选择 一 一 测量 工 
具 已 经 建立 并 且 具 有 可 接受 的 信和 度 和 效 度 水 平一 一 这 不 是 每 一 个 研究 者 
都 进行 的 一 步 , 却 是 本 章 我 们 关注 的 重点 。 

如 果 想 了 解 更 多 ,请 查阅 莱 塞 斯 ，S(Leathers ,S. ) 2003 年 发 表 在 《家 
庭 关 系 》( Family Relations) 第 52 $H 53 ~ 63 页 的 文章 "寄养 儿童 的 父母 拜 
访 ` 冲突 的 忠诚 以 及 情绪 和 行为 问题 ( Parental visiting , conflicting alle- 


giances ,апа епойопа! апа behavioral problems among foster children)” 。 
为 什么 学 习 测 量 
这 是 非常 好 的 问题 。 毕 竟 你 选修 的 是 统计 学 课程 ,而 且 到 现在 为 止 ， 
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学 习 的 内 容 都 是 统计 学 的 内 容 。 现 在 你 所 面 对 的 问题 似乎 属于 检验 和 测 
量 课程 。 那 么 ,这 部 分 内 容 在 统计 学 书 中 有 什么 作用 ? 

这 是 你 应 该 提出 的 一 个 很 好 的 问题 。 为 什么 ?” 到 现在 4 爱 上 统计 学 》 
所 窗 盖 的 内 容 都 与 收集 、 分 析 和 解释 数据 有 关 。 这 些 内 容 中 非常 重要 的 部 
分 就 是 收集 数据 ,而 且 收 集 数据 的 关键 部 分 就 是 确保 数据 就 是 你 所 认为 应 
该 是 的 数据 一 一 数据 表示 你 想 知 道 的 内 容 。 换 句 话 说 ,如 果 你 在 研究 贫困 
问题 ,你 要 确保 你 用 于 评估 贫困 的 测量 工具 都 能 发 挥 作 用 。 或 者 你 研究 中 
年 男性 的 侵略 性 ,你 要 保证 你 评估 侵略 性 的 任何 工具 能 发 挥 作 用 。 

还 有 更 多 的 很 好 的 信息 …… 如 果 你 想 继续 深造 ,并 且 想 选修 检验 和 测 
量 课程 ,这 一 章 的 介绍 会 极 大 地 促进 你 理解 这 个 领域 和 现在 学 习 的 那些 
课程 。 

为 了 保证 整个 数据 收集 过 程 以 及 那些 代表 一 定 意义 的 数据 都 是 有 用 
的 ,你 首先 要 保证 你 用 于 收集 数据 的 工具 能 发 挥 作 用 。 本 章 将 要 回答 的 基 
本 问题 是 “我 怎么 知道 我 每 一 次 使 用 的 检验 、 量 表 和 工具 等 都 能 发 挥 作 
ЯЗ?” (这 就 是 信和 度 ) ,以 及 “我 怎么 知道 我 每 一 次 使 用 的 检验 、 量 表 和 工具 
等 能 够 测量 我 想 测量 的 内 容 ”( 这 就 是 效 度 )。 


态 如 依恋 的 工具 。 此 外 ,还 有 一 个 很 好 的 原因 。 如 果 你 用 来 收集 
数据 的 工具 是 不 可 信和 或 无 效 的 ,那么 任何 假设 检验 的 结果 都 不 会 
有 绪论。 如 果 你 不 能 确定 检验 能 够 完成 应 该 完成 的 工作 并 且 能 够 
保持 一 致 性 ,那么 你 怎么 知道 你 得 到 的 显著 性 结果 是 由 于 有 问题 
的 检验 工具 还 是 在 零 假设 为 真 的 情况 下 实际 上 拒绝 了 零 假设 (第 
一 类 错误 )? 你 是 否 想 要 一 个 “清白 的 " 零 假设 检验 ? 如 果 是 ,那么 
现在 就 开始 关注 信和 度 和 效 度 。 


À 任何 研究 人 员 都 会 告诉 你 建立 检验 工具 的 信和 度 和 效 度 的 重要 
9» 性 ,不 论 是 对 消费 行为 的 简单 观察 工具 或 者 是 测量 复杂 的 心理 状 
() 


关于 测量 尺度 


在 我 们 对 信和 度 和 效 度 进行 更 多 的 讨论 之 前 ,我 们 首先 要 讨论 不 同类 型 
的 测量 尺度 (scales of measurement) 。 什 么 是 测量 ? 依据 一 定 的 规则 给 观 
察 结果 分 配 一 定 的 数值 一 一 很 简单 。 最 后 得 到 的 就 是 我 们 待 会 儿 要 定义 
的 不 同 的 尺度 ,而 且 一 个 观察 结果 可 以 是 我 们 有 兴趣 测量 的 任何 事物 ,如 
头发 的 颜色 性别、 考试 成 绩 或 身高 。 

测量 的 尺度 或 规则 是 测量 观察 结果 的 特定 水 平 。 每 一 个 水 平 都 有 特 
定 的 属性 特征 集 。 测 量 尺度 以 四 种 形式 出 现 ( 或 四 种 类 型 ): 定 类 、 定 序 、 
定 距 和 定 比 。 现 在 简单 地 介绍 并 举例 说 明 四 种 不 同类 型 的 测量 尺度 。 
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政 瑰 的 别称 : 定 类 测量 水 平 


定 类 测量 水 平 (nominal level of measurement ) 是 以 观察 结果 的 属性 特 
征 定义 ,也 就 是 观察 结果 只 适合 一 个 而 且 唯 一 的 一 个 分 类 或 层级 。 例 如 ， 
性 别 是 定 类 变量 (男性 和 女性 ) ;种 族 ( 高 加 索 人 或 非 毅 美国 人 ) 和 政党 背 
景 (共和 党 、 民 主 党 或 无 党 派 人 士 ) 也 是 定 类 变量 。 定 类 水 平 的 变量 是 “名 
称 (name)" (拉丁 语 中 是 nominal ) ,而 且 是 准确 水 平 最 低 的 测量 。 定 类 测 
量 水 平 的 各 个 类 别 相互 排斥 ,例如 ,政党 背景 不 能 同时 是 民主 党 和 共和 党 。 


我 喜欢 任何 次 序 : 定 序 测量 水 平 


定 序 测 量 水 平 (ordinal level of measurement) 的 “ 序 ” 表 示 次 序 ,而 且 被 测 
量 的 事物 按照 它们 的 属性 特征 排序 。 最 好 的 案例 是 一 份 工作 的 应 征 者 的 次 
序 。 如 果 我 们 知道 拉 斯 的 次 序 是 1, 谢 尔 登 的 次 序 是 2, 汉 娜 的 次 序 是 3, 那 
么 这 就 是 定 序 安排 。 我 们 不 知道 就 这 个 尺度 拉 斯 相对 于 谢 尔 登 是 否 比 谢 尔 
登 相对 于 汉 娜 高 多 少 。 我 们 只 是 知道 成 为 次 序 1 比 成 为 次 序 2 和 次 序 3 要 
好 ,但 是 不 知道 好 多 少 。 


1+1=2: 定 距 测 量 水 平 


现在 我 们 进入 某 个 领域 。 当 我 们 谈 到 定 距 测量 水 平 (interval level of 
measurement) ,我 们 是 指 检验 或 评估 工具 是 基于 某 种 连续 体 ,这 样 我 们 就 可 
以 讨论 一 个 较 高 的 成 绩 比较 低 的 成 绩 高 多 少 。 例 如 ,你 的 词汇 测试 成 绩 是 
10 个 单词 正确 ,是 5 个 单词 正确 的 两 倍 。 定 距 尺 度 的 一 个 显著 特征 是 尺度 
上 的 每 个 间距 都 相等 。10 个 单词 正确 比 8 个 单词 正确 多 2 个 ,而 8 个 又 比 5 
个 单词 正确 多 3 个 。 


一 个 人 可 能 一 无 所 有 吗 ? Z rk, | + zk + 


你 可 能 有 些 迷 惑 。 定 比 测量 水 平 (ratio level of measurement ) 的 评估 工 
具 的 特征 是 测量 尺度 中 绝对 零 值 的 存在 。 这 意味 着 没有 要 测量 的 任何 特 
征 。 那 么 让 人 迷惑 的 是 什么 ? 我 们 测量 的 观察 结果 是 否 可 能 是 没什么 可 
测量 的 ? 在 一 些 学 科 中 可 能 存在 这 种 情况 。 例 如 ,在 心理 学 和 生物 学 中 你 
可 以 有 不 存在 属性 特征 的 情况 ,如 绝对 零 值 (没有 分 子 运动 ) 或 零 光 程 。 
在 社会 和 行为 科学 中 ,这 就 比较 让 人 迷惑 了 。 即 使 你 的 拼写 成 绩 是 0 或 者 
答 错 了 IQ 测试 的 每 一 个 题目 ,也 并 不 意味 着 你 的 拼写 能 力 为 0 或 者 智力 
为 0 吧 ? 


这 些 测量 尺度 或 规则 表示 观察 结果 在 特定 水 平 被 测量 。 而 且 ,我 们 可 
以 这 样 说 :任何 的 测量 结果 都 能 够 分 配 到 四 个 测量 尺度 中 的 某 一 个 。 
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e 测量 尺度 有 一 定 的 层次 ,是 从 最 不 准确 的 定 类 尺度 到 最 准确 的 定 比 
尺度 。 

e 测量 尺度 “ 越 高 ” ,收集 的 数据 越 准 确 , 并 且 数 据 包 含 的 细节 和 信息 
越 多 。 例 如 了 解 一 些 人 富裕 一 些 人 贫困 可 能 已 经 足够 (这 是 定 类 
或 分 类 的 区 别 ) ,但 是 准确 地 知道 每 一 个 人 收入 的 多 少 ( 定 距 或 定 
比 ) 会 更 好 。 一 旦 我 们 知道 每 一 个 人 收入 的 所 有 信息 ,我 们 很 容易 
在 “ 穷 "“ 富 "之 间 进 行 简单 的 区 别 。 

• 最 后 ,比较 高 的 测量 尺度 包含 所 有 在 其 之 下 的 测量 尺度 的 特性 ,如 
定 距 尺度 包含 定 类 尺度 和 定 序 尺 度 的 特性 。 例 如 你 知道 熊 的 攻击 
平均 值 是 .350, 你 知道 这 比 老虎 (老虎 的 攻击 平均 值 是 . 250) 好 . 
100 ,同样 你 也 就 知道 能 比 老虎 好 (但 不 知道 好 多 少 ) ,而 且 熊 与 老 
虎 之 间 存 在 不 同 (但 是 不 知道 到 底 怎样 不 同 ) 。 


信和 度 一 一 再 做 一 次 直到 得 到 正确 的 什 


信和 度 (reliability ) 很 好 解释 。 信 和 度 就 是 一 个 测试 或 者 你 使 用 的 其 他 任 
何 测量 工具 对 事物 的 测量 可 以 保持 一 致 性 。 如 果 你 在 特定 的 处 理 方案 之 
前 进行 人 格 测试 ,那么 四 个 月 之 后 再 进行 的 相同 测试 是 否 可 信 ? 这 是 一 个 
问题 。 这 也 是 为 什么 有 不 同 的 信 度 类 型 ,定义 信 度 之 后 我 们 会 对 每 一 类 型 
的 信和 度 进行 更 多 的 介绍 。 


考试 成 绩 一 一 真 本 事 还 是 运气 


你 参加 这 个 课程 的 考试 ,得 到 一 个 成 绩 ,可 能 是 89 分 (这 很 好 ) 或 65 
分 (需要 好 好 学 习 )。 这 样 的 考试 包含 几 个 不 同 要 素 ,包括 观察 值 (ob- 
served score, 你 实际 得 到 的 考试 成 绩 , 如 89 分 或 65 分 ) 和 真实 值 (true 
score ,真实 的 ,100% 准确 反映 你 对 学 习 内 容 的 真实 掌握 ) 。 我 们 不 能 直接 
测量 真实 的 成 绩 , 因 为 这 个 值 是 个 体 所 拥有 的 实际 的 特征 或 特性 在 理论 上 
的 数据 反映 。 

它们 为 什么 不 相同 ? 如 果 考 试 ( 以 及 相应 的 观察 值 ) 是 对 测量 内 容 的 
完美 反映 (我 们 是 指 绝 对 的 完美 ) ,它们 就 会 是 相同 的 。 

但 是 人 们 不 能 保持 长 胜 , 错 误 总 是 在 不 经 意 间 。 墨 菲 定 律 (Murphy ' s 
law) 告诉 我 们 世界 并 不 完美 。 因 此 ,你 看 到 的 是 观察 值 可 能 非常 接近 真实 
值 ,但 是 很 少 相 同 。 而 差异 就 如 你 在 这 里 看 到 的 一 一 包含 在 将 要 介绍 
的 误差 中 。 


观察 值 = 真实 值 + 2 £ (ñ 


误差 ? 的 确 是 误差 。 例 如 ,我们 假定 某 个 学 生 的 统计 学 成 绩 是 89 分 ， 
但 是 他 的 真实 成 绩 ( 我 们 永远 不 会 真 的 知道 ,只 是 理论 上 可 以 假定 ) 是 80 
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分 。 这 意味 着 9 分 的 差异 (就 是 误差 成 绩 ) 是 由 于 误差 造成 的 ,或 者 说 是 个 
人 考试 成 绩 与 100% 真实 成 绩 不 同 的 原因 。 

这 样 的 误差 的 来 源 是 什么 ? 可 能 是 考试 的 房间 太 热 而 让 你 犯困 ,这 肯 
定 对 你 的 考试 成 绩 有 影响 。 或 者 是 由 于 你 没有 按 计划 为 考试 复习 。 这 两 
个 例子 都 反映 考试 的 环境 或 状况 而 不 是 被 测量 的 特征 ,对 吧 ? 

我 们 的 工作 是 尽 可 能 减少 误差 ,例如 改善 考试 环境 并 且 保 证 你 能 得 到 
足够 的 睡眠 。 减 少 误差 ,增加 信和 度 , 这 样 观察 值 才 能 和 真实 值 更 匹配 。 

误差 越 小 就 越 可 信 一 一 这 很 简单 。 


信和 度 的 不 同类 型 


信和 度 有 几 种 不 同 的 类 型 ,现在 主要 介绍 最 重要 也 是 最 常用 的 四 种 类 
型 。 这 几 种 类 型 都 总 结 在 表 16.1 中。 
表 16.1 信和 度 的 不 同类 型 , 何 时 使 用 ,如 何 计算 以 及 它们 的 意义 





说 
信和 度 的 类 型 何 时 使 用 如 何 计算 ОТ "теке 
再 测 信 度 你 想 知道 一 个 测试 在 不 ”计算 时 期 1 和 时 期 2 相同 测 不 同时 期 的 青少年 认同 
同时 间 是 否 可 信 试 的 两 次 值 之 间 的 相关 系数 ”的 形成 的 邦 佐 ( Bonzo) 


测试 是 可 信和 的 。 


平行 形式 信 度 “你 想 知道 一 个 测试 的 几 ”计算 一 种 形式 测试 的 值 与 相 人格 测试 的 两 种 形式 是 


ІНІ 


种 不 同形 式 是 否 可 信 或 ” 同 内容 的 另 一 种 形式 的 测试 ”等 价 的 ,而 且 表 现 出 平 


者 是 否 是 等 价 的 (不 是 完全 相同 的 测试 ) 的 行 形式 的 信和 度 。 
测试 值 之 间 的 相关 系数 
内 在 一 致 性 你 想 知道 一 个 测试 的 项 每 一 个 项 目的 得 分 与 总 得 分 SMART 创造 性 测试 的 
目 是 否 评 价 一 个 而 且 只 ”之 间 的 相关 系数 。 所 有 项 目 评价 相同 
评价 一 个 维度 结构 。 
评分 者 信 度 。 ”你 想 知道 对 一 个 观察 结 ”检验 不 同 评分 者 一 致 结论 的 ”最 佳 着 装 足球 运动 员 评 
果 的 评价 是 否 具有 一 百分比 。 价 的 不 同 评分 者 信 度 
致 性 是 .91 ,表示 不 同 裁判 的 
一 致 程度 很 高 。 


再 测 信 度 (前 测 -后 测 信 度 ) 


再 测 信和 度 ( test-retest reliability ) 用 于 检验 一 个 测试 在 不 同时 期 是 否 
可 信 。 

例如 ,你 想 建 立 检 验 不 同类 型 职业 项 目的 选择 偏好 的 测试 。 你 在 六 月 
份 进行 了 测试 ,接着 在 九 月 份 进行 了 相同 的 测试 (保持 相同 很 重要 )。 那 
么 你 计算 两 次 测试 的 得 分 集 ( 记 住 是 相同 的 人 进行 了 两 次 测试 ) 是 否 相 
关 , 也 就 是 进行 了 信 度 的 测试 。 再 测 信 度 是 检验 不 同时 间 的 变化 或 差异 所 
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ааа 爱 上 统计 学 
必需 的 信和 度 。 

你 必须 确保 你 测量 的 内 容 是 以 可 信和 的 方式 测量 的 ,这 样 你 得 到 的 测试 
结果 才 可 能 与 每 个 个 体 每 个 时 间 的 值 更 接近 。 

计算 再 测 信和 度 。 下 面 给 出 MVE( 管 理 职 业 教育 测试 ) 在 时 期 1 和 时 期 
2 的 部 分 测试 值 。 我 们 的 目标 是 计算 皮尔 逊 相关 系数 作为 这 一 测量 工具 
的 再 测 信和 度 。 


测试 者 编号 时 期 1 得 分 时 期 2 得 分 


1 54 56 
2 67 77 
3 67 87 
1 83 89 
ты 87 89 
6 89 90 
7 84 87 
8 90 92 
9 98 99 


© 


65 76 





这 个 过 程 的 第 一 步 和 最 后 一 步 是 计算 皮尔 逊 积 矩 相关 系数 (复习 第 5 
章 相 关内 容 ) ,这 个 值 等 于 .90 


Trimal .Time? =- 90 


我 们 会 简短 地 解释 这 个 值 。 
平行 形式 信和 度 


平行 形式 信 度 (parallel forms reliability ) 用 于 检验 相同 测试 的 不 同形 
式 的 等 价 性 和 相似 性 。 

例如 ,你 在 研究 记忆 ,部 分 研究 内 容 是 看 一 眼 给 定 的 10 个 单词 并 尽 可 
能 记 住 ,然后 在 20 秒 钟 记忆 、10 秒 钟 休息 之 后 背诵 这 些 单词 。 因 为 这 些 
研究 的 进行 需要 两 天 的 时 间 , 也 涉及 一 些 记忆 技能 的 培训 ,你 需要 符合 研 
究 任 务 要求 的 另 一 组 单词 ,而且 很 明显 不 能 是 相同 的 那些 词 。 因 此 ,你 建 
立 男 一 个 词汇 清单 ,而 且 希 望 这 个 词汇 清单 和 上 一 个 类 似 。 在 这 个 案例 
中 ,你 希望 不 同形 式 的 一 致 性 很 高 一 一 测试 内 容 相 同 , 只 是 形式 不 同 。 

计算 平行 形式 信和 度 。 下 面 给 出 来 自 IRMT( 自主 记忆 测试 ) 的 形式 A 
和 形式 В 的 部 分 数据 。 我 们 的 目标 是 计算 皮尔 逊 相关 系数 作为 测量 工具 
的 平行 形式 信 度 。 
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测试 者 编号 Жақ A 得 分 形式 В 得 分 
1 4 5 
2 5 6 
3 3 5 
4 6 6 
5 7 7 
6 5 6 
7 6 7 
8 4 8 
9 3 7” 
10 3 7 


这 个 过 程 的 第 一 步 和 最 后 一 步 是 计算 皮尔 逊 积 矩 相关 系数 (复习 第 5 
章 相 关内 容 ) ,这 个 值 等 于 


T FormA-FörmB =. 13 


我 们 会 简短 地 解释 这 个 值 。 
内 在 一 致 性 信 度 


内 在 一 致 性 信和 度 (internal consistency reliability ) 与 之 前 介绍 的 前 两 种 
类 型 非常 不 同 。 内 在 一 致 性 信和 度 用 于 确定 测试 中 的 项 目 是 否 彼 此 一 致 ,都 
只 表示 一 个 维度 .一 个 结构 或 一 个 关注 的 领域 。 

例如 ,你 在 进行 对 不 同类 型 的 医疗 保健 的 态度 测试 ,而 且 你 想 确保 这 
一 组 5 个 项 目 都 是 对 态度 而 不 是 其 他 的 测试 。 你 会 看 到 (一 个 测试 群体 ) 
每 一 个 项 目的 得 分 ,然后 确定 个 体 得 分 是 否 和 总 体 得 分 相关 。 你 预期 在 某 
个 项 目 上 得 分 高 (例如 ,我 喜欢 我 的 HMO 一 一 美国 健康 保护 组 织 ) 的 测试 
者 会 在 其 他 项 目 上 得 分 低 ( 例 如 ,我 不 想 在 医疗 保健 上 花 钱 ) ,而 且 这 对 所 
有 的 测试 者 都 是 一 样 的 。 

计算 ә 系数 或 克隆 巴赫 系数 (Cronbach's) 。 下 面 给 出 10 个 测试 者 在 

5 个 态度 项 目测 试 (我 爱 HMO 测试 ) 上 的 部 分 样本 数据 ,其 中 每 个 项 目的 

得 分 在 1( 非 常 不 同意 ) 到 5( 非 常 同 意 ) 之 间 。 


测试 者 编号 项 目 1 项 目 2 项 目 3 项 目 4 项 目 5 
1 3 5 1 4 1 
4 4 3 5 3 
3 3 4 4 4 4 
4 3 3 5 2 1 
5 3 4 5 4 3 
6 4 5 5 3 2, 
7 2 5 5 3 4 
8 3 4 4 2 4 
9 3 5 4 4 3 
10 3 3 3 3 2 | 
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© 当 你 计算 克隆 巴赫 系数 (以 Lee Cronbach 命名 ) ,实际 上 就 是 

>, N 计算 每 个 测试 者 在 每 个 项 目 上 的 得 分 和 总 的 得 分 之 间 的 相关 系 

AE 数 , 并 与 所 有 单个 项 目 得 分 的 变异 性 比较 。 计 算 的 逻辑 是 每 个 总 
分 很 高 的 测试 者 在 每 一 个 项 目 上 的 得 分 应 该 也 很 高 (如 总 分 40 的 
测试 的 每 一 个 项 目的 得 分 为 5,5,3,5 ,3 ,4,4,2,4,5) ,而 每 个 总 分 
很 低 的 测试 者 在 每 一 个 项 目 上 的 得 分 应 该 也 很 低 ( 如 总 分 40 的 测 
试 的 每 一 个 项 目的 得 分 为 5,1,5,1,5,5,1,5,5,1,5,1, 就 是 缺少 一 
致 性 或 者 不 是 一 维 的 )。 





下 面 是 计算 克隆 巴赫 系数 的 公式 : 
_ (k ys" Ув 
sa (x — 1 | | 4 | 
其 中 
k 表示 项 目的 个 数 
s 表示 观察 值 的 方差 


> s; 表示 每 一 个 项 目的 方差 的 总 和 
下 面 的 数据 与 前 面 是 相同 的 ,还 加 上 了 完成 上 面 的 等 式 需要 计算 的 值 
(观察 值 的 方差 ,或 s, ,以 及 每 个 项 目的 方差 的 总 和 ,或 У 52). 


es 
测试 者 编号 项 目 1 项 目 2 项 目 3 项 目 4 项 目 5 总 分 


о 
л 
is 
ы 
= 
T 


о oo м ON \л ы оу м 
ш ы о о о + 
лы ы ы + 
лл (д (л ш 
ш ыы о 
tb ы ы ы жын ы ш 

© 


—— 
© 


观察 值 方差 0. 32 0.62 1.96 0.93 1.34 =5.17 


将 具体 的 数值 代入 这 个 公式 ,你 就 会 得 到 下 面 这 个 等 式 ， 


e EJE) =a 


你 会 发 现 9 系数 为 . 24 ,现在 你 已 完成 了 内 在 一 致 性 信 度 计算 (之 后 对 


ww 53 记 世人 二 欣 最 好 的 股票 论坛 理想 在 线 证 券 网 欢迎 您 


www.55188.com 最 好 的 股票 论坛 理想 在 线 证 券 网 欢迎 您 | 


6 ŠERE EE 199 


© 如 果 我 们 告诉 你 还 有 许多 其 他 类 型 的 内 在 一 致 性 信和 度 ,你 不 
SN 会 感到 惊讶 吧 ? 这 对 内 在 一 致 性 的 测量 来 说 是 事实 。 不 仅 有 9 R 
数 ,也 有 折 半 信和 度 , 斯 皮尔 曼 - 布 朗 (Spearman-Brown ) ,Kuder-Rich- 


ardson 20 和 21( КЕ, 与 КА, ) ,以 及 其 他 进行 这 类 测试 的 系数 , 它 
们 只 是 以 不 同 的 方式 检验 测试 工具 的 一 维 性 。 


使 用 计算 机 计算 克隆 巴赫 系数 


一 旦 你 知道 如 何 手动 计算 克隆 巴赫 系数 ,你 将 会 想 使 用 SPSS 来 计算 , 
两 者 的 转换 非常 容易 。 我 们 使 用 本 章 之 前 给 出 的 数据 集 (10 个 测试 者 的 5 
项 目测 试 ) Q 
1. кылы di 要 确保 不 同 的 项 目 在 不 同 的 列 。 
2. 点 击 Analyze 一 "Scale 一 Reliability Analysis , 你 就 会 看 如 图 16. 1 所 示 的 
对 话 杠 。 
ШЕ Reliability Analysis 


ФО 


|æ vaR00002 
| gb VaR00003 
D VAR00004 I 
|æ УАН00005 а 
ab VaRD0006 





Model: | Alpha | " 
| [ List item labels Statistics... | 





16.1 信和 度 分 析 对 话 框 
З. 双击 变量 将 每 个 变量 移 到 items ЖЕ. 
一 定 要 选择 菜单 左下 角 Model 之 下 的 Alpha, 
4. 点 击 ОК, SPSS 执行 分 析 过 程 然 后 得 出 图 16.2 所 示 的 结果 。 
SPSS 输出 结果 的 含义 


就 如 你 所 看 到 的 ,alpha 系数 为 .2387 ,非常 接近 我 们 手动 计算 的 值 。 
SPSS 输出 结果 不 能 告诉 你 整个 过 程 ,只 能 得 到 个 结 采 。 
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-» Reliability 


Method 1 (space saver) will be used for this analysis ****** 


RELIABILITY ANALYSIS - PELLE (ALPHA) 


Reliability Coefficients 
N of Cases= 10.0 N of ltems=5 
Alpha= .2387 





图 16.2 信 度 分 析 的 SPSS 输出 结果 
评分 者 信 度 


评分 者 信和 度 (interrater reliability ) 是 两 个 评分 者 对 观察 结果 判断 的 一 
致 程度 的 测量 。 

例如 ,你 的 研究 兴趣 是 银行 工作 人 员 和 经 常 账户 的 顾客 在 交易 过 程 中 
的 相互 作用 类 型 ,你 在 现场 观察 (在 单 面 镜 后 观察 ) 银行 工作 人 员 在 接受 
了 新 的 或 高 级 的 顾客 关系 课程 之 后 是 否 会 发 生 面 对 潜在 顾客 微笑 等 友善 
的 行为 。 你 的 工作 是 记录 每 10 秒 内 银行 工作 人 员 是 否 展示 课程 所 教 的 三 
种 不 同 的 行为 类 型 微笑 、 坐 着 时 身体 前 倾 或 者 用 手指 出 某 个 要 点 。 每 
次 看 到 三 种 行为 中 的 任何 一 种 出 现 ,就 在 你 的 积分 表 上 标注 “/”。 如 果 没 
有 观察 到 任何 一 种 ,就 标注 为 “一 ”。 

作为 这 个 过 程 的 一 部 分 ,而 且 为 了 保证 你 的 记录 是 可 信 的 ,你 需要 知 
道 不 同 的 观察 者 记录 这 些 行为 发 生 的 一 臻 水平。 记录 的 形式 越 类 似 , 不 同 
的 评分 者 的 一 致 水 平和 信和 度 就 越 高 。 

计算 评分 者 信 度 。 在 这 个 案例 中 ,真正 重要 的 问题 是 在 两 分 钟 内 每 
10 秒 钟 (或 者 是 12 个 10 秒 钟 内 ) 对 顾客 的 友好 行为 是 否 发 生 。 因 此 ,我 
们 要 看 的 是 在 分 成 12 个 10 秒 钟 的 2 分 钟 的 时 间 框 架 内 纪录 的 一 致 性 。 
记录 表 中 一 个 斜 线 (Z) 代表 着 行为 发 生 , 一 个 横 线 (一 ) 表示 行为 没有 


发 生 。 
ma ls eT Te Ts 


ЕІЕ-ЛИЕИЙЙЕИЙЫНИЙ 
记录 者 2 | AMA 


在 12 个 时 期 内 (存在 12 个 可 能 的 一 致 ) , 戴 夫 与 莫 瑞 恩 一 致 认 为 有 7 
个 时 期 行为 发 生 ( 时 期 1,3,4,5,7,8 和 12) ,3 个 时 期 行为 没有 发 生 ( 时 期 
2,6 和 9) ,也 就 是 说 有 10 个 记录 一 致 ,而 剩 下 2 个 记录 不 一 致 。 
评分 者 信 度 可 以 使 用 下 面 的 简单 公 — 
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代入 具体 的 数值 就 会 得 到 下 面 的 等 式 : 
10 


评分 者 之 间 的 信 度 =] =. 833 


最 后 得 到 的 评分 者 信和 度 系 数 是 . 833. 
多 大 才 是 火 一 一 解释 信和 度 系数 


现在 我 们 开始 讨论 信 度 系数 。 你 是 否 还 记得 第 5 章 所 学 的 对 相关 系 
数 的 解释 ? 这 与 解释 信 度 系数 几乎 是 相同 的 ,只 有 很 小 的 差异 。 

我 们 只 需要 确定 两 个 方面 ,也 就 是 : 

。 信 度 系数 是 正 向 的 ,而 不 是 负 向 的 

。 信 度 系数 一 般 都 很 大 (在 .00 和 +1.00 之 间 ) 

例如 ,回顾 本 章 这 部 分 讨论 的 四 种 信 度 类 型 以 及 我 们 计算 的 信 度 系 
数 ,然后 进行 判断 。 


如 果 你 不 能 建立 信 度 ,怎么 办 


建立 某 个 测试 的 信 度 的 道路 并 不 平坦 ,而 且 不 是 出 于 没有 好 好 工作 的 
原因 。 如 果 测 试 是 不 可 信 的 该 怎么 办 ? 
下 面 的 几 个 方面 需要 说 记 在 心 。 记 住 信 度 是 代表 观察 值 产生 的 误差 
的 多 少 的 一 个 函数 。 误 差 越 小 ,信和 度 就 越 高 。 
ө 在 进行 测试 时 ,我 确保 对 所 有 题 项 的 设置 都 是 标准 化 的 。 
e 增加 项 目 或 者 观察 的 数量 ,因为 从 你 观察 的 总 体 行 为 中 得 到 的 样本 越 
大 ,样本 的 代表 性 和 信 度 越 高 。 特 别 是 对 成 绩 的 测试 来 说 这 是 事实 。 
ө 去 掉 有 歧义 的 项 目 ,因为 一 些 人 会 做 出 一 种 反应 ,另外 一 些 人 会 做 
出 不 同 的 反应 ,无 论 他 们 的 知识 、 能 力 水 平 或 个 性 特征 如 何 。 
e 特别 是 对 成 绩 测试 (如 拼写 考试 .历史 考试 ) 来 说 ,应 当 注 意 调整 测 
试 的 容易 程度 和 难度 ,因为 任何 测试 太 难 或 太 容易 都 不 能 准确 地 反 
映 一 个 人 的 成 绩 。 
e 减少 外 部 事件 的 影响 ,并 且 将 答题 指导 标准 化 ,因此 如 果 特定 事件 在 临 
近 测 试 时 发 生 , 如 狂欢 节 ( Mardi gras) 或 毕业 ,就 要 推迟 测试 的 进行 。 


还 有 一 点 


建立 具备 合理 的 心理 特征 的 测验 工具 的 第 一 步 是 建立 信和 度 ( 我 们 只 
需 多 花费 一 些 时 间 就 行 )。 为 什么 ,如 果 测 试 或 测量 工具 不 可 信 , 或 者 没 
有 一 致 性 ,而 且 不 能 在 不 同 的 时 间 进 行 相 同 的 测试 ,那么 测量 到 什么 还 重 
要 (这 是 效 度 问 题 ) 吗 ? 

你 可 以 容易 地 进行 拼写 入 门 的 KACAS( Kids Are Cool at Spelling , 孩子 
对 拼写 很 在 行 ) 测 斌 ,开始 的 三 个 项 目 可 能 是 : 
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21 +13 =? 
41 +33 =? 


这 肯定 是 信 度 很 高 的 测试 ,但 是 肯定 不 是 有 效 的 测试 。 现 在 我 们 对 信 
度 已 经 有 了 很 好 的 了 解 , 接 下 来 开始 介绍 效 度 。 


效 度 一 一 哦 ! 真相 是 什么 


效 度 (validity) ,最 简单 地 说 ,就 是 表示 工具 能 够 测量 要 测量 的 内 容 的 
性 质 。 有 效 的 测试 是 测量 应 该 测量 的 内 容 。 如 果 成 绩 测试 是 测量 历史 知 
识 , 那 么 就 测量 历史 知识 。 如 果 智 商 测试 是 测量 测试 建立 者 定义 的 智商 内 
容 , 那 么 就 是 测量 这 个 。 


效 度 的 不 同类 型 


就 如 信 度 有 不 同 的 类 型 , 效 度 也 有 不 同 的 类 型 ,我 们 介绍 最 重要 也 是 
最 常用 的 三 种 类 型 。 这 几 种 类 型 都 总 结 在 表 16.2 中 。 
%16.2 效 度 的 不 同类 型 , 何 时 使 用 ,如 何 计算 以 及 它们 的 意义 


效 度 的 类 型 ” 何 时 使 用 如 何 计算 举例 说 明 对 所 得 结果 的 
含义 
内 容 效 度 。 ”你 想 知道 一 个 特定 主 ”请 教 专家 ,让 专家 判断 测试 ”我 的 统计 学 课程 的 每 周 测 
题 的 项 目 样本 是 否 能 ”的 项 目 是 否 反映 将 要 测量 的 ” 试 可 以 评价 每 章 的 内 容 
够 反映 项 目 总 体 主题 的 项 目 总 体 
准则 效 度 ”你 想 知道 测试 成 绩 是 ”计算 测试 成 绩 和 其 他 有 效 的 ”研究 显示 毫 调 技能 的 EAT 
否 和 其 他 标准 系统 相 ”测量 之 间 的 相关 系数 ,并 评 ШАН ЕЛ 


关 , 这 个 标准 表明 被 ” 价 相同 的 一 组 能 力 年 内 成 为 主 厨 相关 ( 预测 
测试 者 具备 某 个 领域 效 度 的 一 个 案例 ) 
的 能 力 


建构 效 度 。 ”你 想 知 道 测试 是 否 测 ” 计 算 测 试 成 绩 和 反映 测试 设 这 是 真实 的 一 一 参与 身体 
量 一 些 基 本 的 心理 计 的 结构 的 理论 结果 之 间 的 ”接触 和 危险 性 运动 的 男性 
结构 相关 系数 的 侵略 性 TEST 测试 的 得 

分 较 高 





内 容 效 度 


内 容 效 度 (content validity ) 就 是 测试 项 目 能 代表 设计 测试 要 测量 的 总 
体 项 目的 性 质 。 内 容 效 度 常 用 于 成 绩 测试 (例如 从 一 年 级 的 拼写 测试 到 | 
学 术 能 力 测 试 的 任何 测试 ) 。 

建立 内 容 效 度 。 建 立 内 容 效 度 实际 上 非常 容易 。 所 有 你 需要 做 的 就 
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的 物理 专家 (也 许 是 地 方 高 中 的 教师 或 者 大 学 教授 物理 学 的 教授 ) , 而且 
我 会 说 “ 嗨 , 艾 伯 特 ,你 看 这 100 个 多 项 选择 题 能 不 能 准确 地 反映 我 期 望 我 
的 入 门 课 的 学 生 掌 握 的 所 有 可 能 的 主题 和 概念 ?” 

我 可 能 告诉 艾 伯 特 具体 的 主题 是 什么 ,然后 他 或 她 看 了 具体 题目 之 后 
就 会 给 出 这 些 题目 是 否 符 合 我 建立 的 标准 一 一 代表 入 门 课程 中 的 全 部 内 
如 果 答 案 是 肯定 ,我 就 完成 了 设计 (至 少 就 现在 而 言 )。 
如 果 答 案 是 否定 ,就 要 重新 开始 建立 新 的 题目 标准 或 者 修正 现存 的 题目 。 


准则 效 度 


准则 效 度 (criterion validity ) 是 评价 测试 是 否 反 映 现 在 和 未 来 的 一 组 
能 力 。 如 果 准 则 是 发 生 在 现在 ,我 们 就 讨论 同步 效 度 (concurrent criterion 
validity) 。 如 果 准 则 是 发 生 在 未 来 ,我 们 就 讨论 预测 效 度 (predictive con- 
current validity) 。 对 于 准则 效 度 的 应 用 ,不 需要 同时 建立 同步 效 度 和 预测 
效 度 ,按照 测试 目的 的 需要 选择 适用 的 那个 就 行 了 。 

建立 同步 效 度 。 例 如 你 受 雇 于 世界 赢 饪 学 院 设 计 测 量 亮 饪 技能 的 工 
具 。 豪 饪 培训 的 部 分 内 容 与 直接 的 知识 有 关 ( 例 如 什么 是 奶油 面粉 糊 ? 
这 属于 成 绩 测试 的 内 容 )。 

于 是 ,你 建立 了 你 认为 能 够 很 好 测量 豪 饪 技能 的 测试 表 , 现在 你 想 建 
立 同 步 效 度 水 平 。 为 完成 这 项 工作 你 设计 了 豪 饪 量 表 (COOK scale) ,将 每 
个 裁判 都 使 用 的 判断 标准 (如 呈现 、 清 洁 等 ) 以 5 分 制 的 项 目的 形式 集中 
在 一 起 。 作 为 标准 (这 是 关键 ) ,你 还 有 另 一 个 裁判 组 ,他们 将 学 生 的 整体 
技能 进行 从 1 到 10 的 等 级 排序 。 接 着 只 需要 计算 豪 饪 量 表 得 分 和 裁判 的 
排序 之 间 的 相关 系数 。 如 果 效 度 系数 (简单 相关 系数 ) 很 高 ,你 的 设计 很 
好 ,否则 就 需要 重新 开始 。 

建立 预测 效 度 。 例 如 我 们 知道 豪 饪 学 校 十 年 来 发 展 得 很 好 , 而 你 不 仅 
仅 对 厨师 厨 艺 的 好 坏 感 兴趣 (这 是 你 刚才 建立 的 同步 效 度 的 部 分 ) , 而 且 
对 预测 效 度 也 感 兴趣 。 现 在 准则 已 经 从 现在 当下 的 得 分 (裁判 的 给 分 ) 转 
变 为 未 来 的 得 分 。 

现在 我 们 的 兴趣 是 建立 一 个 测试 ,可 预测 一 个 厨师 10 年 后 的 成 功 。 
要 建立 豪 饪 测试 的 预测 效 度 , 你 要 回顾 并 找到 结束 豪 饪 课程 后 10 年 仍然 
从 事 豪 饪 工作 的 毕业 生 , 对 他 们 进行 测试 。 这 里 使 用 的 标准 是 他 们 成 功 的 
水 平 ,而 且 你 使 用 的 测量 指标 是 (a) 他 们 是 否 有 自己 的 餐馆 ,(b) 稀 馆 经 营 
是 否 超过 1 年 (因为 新 餐馆 经 营 的 失败 率 在 第 1 年 就 超过 80% )。 基 本 原 
理 是 如 果 和 餐馆 经 营 超 过 一 年 ,那么 主 厨 的 厨 艺 一 定 很 好 。 

要 完成 这 项 练习 ,就 要 计算 值 为 1( 如果 和 餐馆 经 营 超 过 1 年 并 且 是 毕 
业 生 所 有 ) 的 豪 饪 得 分 与 之 前 的 (10 年 前 ) 豪 饪 得 分 之 间 的 相关 系数 。 较 
高 的 相关 系数 表明 具有 预测 效 度 , 较 低 的 相关 系数 表明 缺乏 预测 效 度 。 
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建构 效 度 


建构 效 度 (construct validity ) 是 最 有 趣 也 是 最 难 建 立 的 效 度 ,因为 建构 
效 度 是 基于 测试 或 测量 工具 背后 的 基本 的 结构 或 概念 的 。 

你 可 能 从 你 的 初级 心理 学 学 习 中 了 解 了 ,结构 是 一 群 相 关 的 变量 。 例 
如 侵略 性 是 一 个 结构 (包括 不 恰当 的 碰 触 、 暴 力 、 缺 乏 成 功 的 社会 交往 等 
等 ) ,智力 、 母 婴 依 恋 和 和 希望 等 同样 都 是 结构 。 而 且 要 记 住 的 是 这 些 结构 
来 和 目 某 种 研究 者 假定 的 理论 视角 。 例 如 ,他 或 她 认为 有 侵略 倾向 的 男性 比 
没有 侵略 倾向 的 男性 更 容易 陷 人 与 权威 的 了 矛盾 中 。 

建立 建构 效 度 。 好 ,现在 你 拿 着 好 斗 性 ( FIGHT test) 测试 (基于 侵略 
性 的 ) 量 表 , 它 是 由 一 系列 依据 你 对 侵略 性 结构 构成 的 理论 概括 编 出 的 项 
目 构 成 的 观察 工具 。 你 从 犯罪 学 的 文献 中 了 解 到 具有 侵略 性 的 男性 会 比 
其 他 人 更 容易 做 出 某 种 类 型 的 行为 ,例如 他 们 更 多 地 与 人 争论 ,他 们 更 易 
БА БОК (АНЕ) , 犯 下 更 多 的 暴力 罪行 ,而 且 在 人 际 关系 方面 更 少 
能 取得 成 功 。 好 斗 性 量 表 包括 的 项 目 描述 了 不 同 的 行为 ,其 中 一 些 行为 在 
理论 上 和 侵略 性 行为 有 关 , 其 中 一 些 无 关 。 一 旦 好 斗 性 量 表 完成 ,你 就 应 
该 检验 结果 来 确定 好 斗 性 量 表 的 得 分 与 你 预测 的 行为 类 型 (如 卷 人 犯罪 
的 水 平 或 人 际 关系 的 性 质 等 ) 之 间 是 否 相 关 , 以 及 是 和 否 与 理论 上 应 当 无 关 
的 行为 类 型 (如 没有 遭遇 家 庭 暴 力 或 完成 高 中 、 大 学 学 业 等 ) 不 相关 。 如 
采 你 预期 相关 的 项 目的 相关 系数 很 高 ,而且 预期 无 关 的 项 目的 相关 系数 很 
低 , 那 你 所 应 用 的 好 斗 性 量 表 ( 而 且 很 可 能 是 你 设计 的 那些 不 是 评价 侵略 
性 要 素 的 项 目 起 了 作用 ) 是 有 效 的 。 恭 喜 你 ! 


如 果 不 能 建立 效 度 …… Я 2 Е. 2 


这 个 问题 很 难 回 答 ,特别 是 因为 效 度 类 型 是 如 此 之 多 。 

总 之 ,如 果 你 没有 得 到 你 想 要 的 效 度 证 明 , 这 是 由 于 你 的 测试 没有 测 
试 你 要 测试 的 内 容 。 如 果 是 成 绩 测试 ,而 且 满 意 的 内 容 效 度 水 平 是 你 要 寻 
求 的 ,那么 你 可 能 要 重新 设计 测试 的 问题 以 确保 这 些 问 题 与 专家 认为 应 该 
测试 的 问题 保持 一 致 。 

如 果 你 关注 准则 效 度 ,你 可 能 需要 重新 检验 测试 的 项 目的 性 质 , 并 且 
回答 你 期 望 人 们 的 回答 与 你 选 定 的 准则 之 间 有 多 大 的 相关 程度 的 问题 。 

最 后 ,如 果 你 寻求 建构 效 度 并 且 不 能 找到 一 一 最 好 要 认真 思考 支持 你 
建立 测试 的 理论 基础 。 或 者 是 我 们 关于 侵略 性 的 定义 和 模型 是 错 的 ,或 者 
是 知识 还 需要 一 些 批判 性 的 思考 。 


最 后 的 建议 
测量 是 一 件 相当 酷 的 事 一 一 能 激 起 人 们 的 兴趣 ,而 且 在 注重 责任 的 时 
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Aiie 激增 的 兴趣 ,使 得 撰写 学 年 论文 或 毕业 论文 的 大 学 
生 或 者 扎 写 毕业 论文 或 学 位 论文 的 研究 生 都 十 分 倾向 于 给 他 们 的 论文 方 
2 

但 要 注意 的 是 , 听 起 来 很 好 的 想法 可 能 导致 的 是 一 场 灾难 。 建 立 任何 
工具 的 信和 度 和 效 度 的 过 程 都 需要 几 年 的 紧张 工作 。 而 且 可 能 使 得 这 个 过 
程 更 糟糕 的 是 单纯 的 或 无 怀疑 精神 的 人 想 建立 新 的 工具 检验 新 的 假设 。 
这 意味 着 在 检验 新 的 假设 的 同时 ,还 得 确保 新 的 工具 发 挥 作用 。 





信和 度 和 效 度 :很 亲 的 党 表 兄 第 关 系 


agua kiasa г 
这 是 必须 要 学 习 的 内 容 。 这 章 很 重要 ,因为 你 需要 了 解 你 用 于 测量 结 

果 的 工具 的 信和 度 和 效 度 。 ма ? 如 果 工 具 既 不 可 信 又 无 效 ,你 的 实验 结 
果 也 就 让 人 怀疑 。 

就 如 本 章 之 前 提 到 的 ,你 的 测试 可 能 是 可 信和 却 无 效 的。 但 是 ,你 的 有 
效 的 测试 却 不 可 能 没有 信和 度 。 为 什么 ? 不 论 一 个 测试 测试 的 是 什么 都 可 
以 重复 进行 (这 就 是 信 度 ) ,但 是 可 能 仍然 没有 测量 应 该 测量 的 内 容 ( 这 就 
是 效 度 ) 。 但 是 ,如 果 一 个 测试 确实 测量 了 要 测量 的 内 容 , 那 么 这 个 测试 
就 必然 能 够 实现 一 致 的 测量 。 


А 0 你 可 能 在 本 章 的 其 他 地 方 已 经 看 到 关于 信和 度 和 效 度 关 系 的 内 
N 容 , 但 是 还 存在 一 种 潜在 的 关系 ,你 会 在 之 后 的 课程 中 学 到 ,但 是 
f) 应 该 现在 就 有 所 了 解 。 这 个 潜在 的 关系 是 效 度 的 最 大 值 等 于 信和 度 
系数 的 平方 根 。 例 如 ,如 果 机 械 能 力 倾 向 测试 的 信和 度 系 数 是 . 87, 
效 度 系数 不 会 超过 . 93( 是 . 87 的 平方 根 ) 。 用 专业 语言 表示 就 是 
测试 的 效 度 受到 测试 的 信 度 的 局 限 。 如 果 我 们 在 确定 测试 能 够 测 
试 到 要 测试 的 内 容 之 前 不 必 再 思考 测试 必须 能 够 重复 测试 要 测试 
的 内 容 , 那 可 就 太 好 了 ! 

不 过 这 个 关系 是 如 此 紧密 。 你 不 可 能 有 没有 信和 度 却 有 效 度 的 
工具 ,因为 要 测试 应 该 测试 的 内 容 , 必须 首 先 具有 测试 的 一 致 性 ， 

对 吧 ? 因此 ,信和 度 和 效 度 同时 发 挥 作 用 。 
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小 : Z 
这 就 是 统计 学 课程 里 的 测量 内 容 。 再 提 一 次 ,任何 统计 学 的 应 用 都 是 围绕 
一 些 测 量 的 结果 进行 的 。 就 如 你 需要 基本 的 统计 学 使 得 数据 具有 意义 ,你 也 需 
要 基本 的 测量 信息 使 得 对 行为 \ 考试 成 绩 、 排 序 或 评分 的 评价 有 意义 。 


练习 时 间 
1. 去 图 书馆 查找 5 篇 你 的 专业 领域 的 给 出 信 度 和 效 度数 据 报 告 的 文章 ,并 
且 讨 论 所 用 的 结果 测量 指标 。 确 定 要 建立 的 信 度 类 型 和 效 度 类 型 ,并 且 考 虑 你 
是 否认 为 这 个 水 平 可 接受 。 如 果 不 能 接受 ,如 何 改 进 ? | 
2. 提供 建立 再 测 信和 度 和 平行 形式 信和 度 的 案例 。 
3. 在 检验 任何 实验 假设 时 ,为 什么 用 于 测量 结果 的 测试 工具 的 可 信 性 和 有 
效 性 很 重要 ? 


练习 参考 答案 

1. 自己 来 完成 。 

2. 如 果 你 对 不 同时 间 的 评价 的 一 致 性 感 兴趣 就 使 用 再 测 信 度 ,例如 前 后 测 
试 的 研究 或 纵向 研究 。 平 行 形 式 信 度 对 确定 相同 内 容 测试 的 不 同形 式 的 相似 程 
度 很 重要 。 

3. 你 需要 使 用 既 可 信 又 有 效 的 测试 ,否则 ,即使 你 得 到 零 假 设 作为 结论 ,你 
也 不 能 确定 是 工具 没有 测量 应 测量 的 内 容 还 是 研究 假设 是 错误 的 。 
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你 应 该 了 解 的 其 他 重要 的 统计 过 和 


本 章 你 会 学 到 什么 


e。 高 级 统计 过 程 综述 ,以 及 何 时 如 何 使 用 





《 爱 上 统计 学 》 全 书 只 是 覆盖 了 整个 统计 学 的 一 小 部 分 。 我 们 没有 提 
供 过 多 的 知识 ,更 重要 的 是 初学 时 的 内 容 应 保持 简单 直接。 

但 是 这 并 不 意味 着 你 阅读 最 近 的 研究 文章 或 者 在 课堂 讨论 时 你 不 会 
碰 到 其 他 的 分 析 技 术 ,这 些 技术 很 重要 ,需要 你 有 所 了 解 。 因 此 ,为 了 让 你 
所 学 更 加 全 面 , 这 里 列 出 了 其 他 7 种 统计 技术 ,介绍 它们 的 应 用 ,并 给 出 使 
用 这 些 技术 回答 问题 的 研究 案例 。 


多 元 方差 分 析 


知道 方差 分 析 (ANOVA) 有 多 种 应 用 的 方式 你 可 能 并 不 感到 惊讶 ,每 
一 种 形式 的 设计 都 适合 “两 个 以 上 群体 的 平均 值 比 较 ” 的 特定 情况 。 其 中 
之 一 是 多 元 方差 分 析 (MANOVA) ,用 于 不 止 一 个 依赖 变量 的 情况 。 也 就 
是 不 只 使 用 一 个 结果 变量 或 依赖 变量 。 如 果 依 赖 变量 或 结果 变量 之 间 相 
关 ( 这 种 情况 很 常见 一 一 见 第 11 章 关 于 多 元 t 检验 的 专业 讨论 ) ,就 很 难 
确定 处 理 变量 对 单个 结果 变量 的 影响 。 因 此 ,需要 多 元 方差 分 析 来 解决 这 
个 问题 。 

例如 ,印第安 纳 州 立 大 学 的 乔纳森 ~ ЗЕН ya ( Jonathan Plucker) 研究 天 
才 少 年 处 理学 校 压力 的 性 别 .种 族 和 年 级 差异 。 他 使 用 的 多 元 方差 分 析 分 
析 是 2( 性 别 : 男 性 和 女性 ) x4( 种 族 : 高 加 索 人 、 非 毅 美 国人 \ 亚 毅 美 国人 
和 西班牙 人 ) x5( 年 级 :从 8 年 级 到 12 年 级 )MANOVA。 分 析 的 多 元 变量 
是 青少年 应 对 量 表 的 5 个 子 表 。 使 用 多 元 技术 可 以 相互 独立 地 估计 独立 
变量 (性 别 、 种 族 和 年 级 ) 对 5 个 子 量 表 中 每 一 个 量 表 的 影响 。 

是 否 想 了 解 更 多 ? 查阅 文献 :查阅 普 吕 克 (Plucker, J. А. ) 1998 年 发 
表 在 《天 才 教 育 杂 志 》(Journal for the Education of the Gifted) 21 期 423 ~ 
436 页 的 文章 “天 才 青 少年 的 应 对 策略 的 性 别 、 种 族 和 年 级 差异 (Gender， 
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“ 要 上 统计 学 


гасе ,and grade difference in gifted adolescents’ coping strategies) „” 


重复 测量 的 方差 分 析 


这 是 方差 分 析 的 另 一 种 形式 。 重 复 测 量 的 方差 分 析 非 常 类 似 于 其 他 
的 方差 分 析 ,你 可 以 回顾 第 11 章 的 两 个 或 两 个 以 上 群体 均值 的 差异 检验 。 
束 重 复 测量 的 方差 分 析 来 说 ,参与 者 在 一 个 要 素 上 要 测试 两 次 。 这 也 是 叫 
做 “重复 ”的 原因 ,你 要 对 相同 的 因素 在 不 同 的 时 点 重复 测量 过 程 。 

例如 ,B: (E.T - 菲尔德 .C: 麦克 布 莱 德 了 . JERES 5 - 拉 尔 吉 
(B. Lundy, T. Field, С. Mcbride, Т. Field & S. Largie ) 使 用 高 中 三 年 级 和 四 
年 级 的 数据 检验 同性 和 异性 最 好 朋友 之 间 的 相互 影响 。 他 们 的 主要 分 析 
之 一 是 三 个 因素 的 方差 分 析 : 性 别 (男性 或 女性 ) ,友谊 (同性 或 异性 ) 以 及 
在 高 中 的 年 级 (三 年 级 或 四 年 级 )。 重 复 测量 的 要 素 是 年 级 ,因为 测量 过 
程 是 在 相同 的 测量 主题 上 重复 。 

是 否 想 了 解 更 多 ? 查阅 文献 :B. {Бш т. 菲尔德 .C . 麦克 布 莱 德 、 
T - JEKE 5. 拉 尔 吉 (B. Lundy, T. Field, Т. Mcbride, Т. Field, & 5. 
Largie) 发 表 在 1998 年 《青少年 》(Adolescence) 第 33 卷 130 НЯ 280 ~ 289 页 
的 文章 “高 中 三 年 级 和 四 年 级 中 同性 和 异性 最 好 朋友 之 间 的 相互 影响 
( Same-sex апа opposite-sex best friend interaction among high school juniors 


and seniors)” 


协 方差 分 析 


这 是 我 们 介绍 的 最 后 一 种 方差 分 析 。 协 方差 分 析 (ANCOVA ) 是 特别 
有 趣 的 一 种 形式 ,因为 它 允 许 你 将 群体 之 间 最 初 的 差异 等 量 。 我 们 假定 你 
赞助 一 个 提高 速度 的 项 目 , 而 且 你 想 比 较 两 组 运动 员 在 100 码 冲 刺 中 能 够 
跑 多 快 。 因 为 力量 通常 和 速度 有 关 , 你 必须 做 一 些 修 正 ,这 样 力量 就 不 能 
解释 项 目 结束 时 的 差异 了 。 同 时 ,你 想 了 解 去 除 力量 因素 之 后 的 培训 效 
条。 你 应 该 在 培训 项 目 开 始 之 前 测量 培训 者 的 力量 ,然后 使 用 协 方差 分 析 
来 调整 基于 最 初 力量 的 最 后 速度 。 
吉尔 大 学 的 米 夏 埃 拉 “' 希 涅 约翰. 林 登 与 阿里 . 塔 达 什 (Michae- 
la Hyine ,John Lyndon & АП Tardash ) 在 关于 亲密 行为 和 和 承诺 对 婚前 性 行为 
的 接受 程度 和 使 用 避孕 物品 的 影响 的 研究 中 使 用 了 协 方差 分 析 。 他 们 使 
用 协 方差 分 析 以 社会 接受 度 作 为 依赖 变量 (在 其 中 寻找 群体 差异 ) .特殊 
事件 的 排序 作为 协 变 量 。 协 方差 分 析 能 够 保证 社会 接受 度 的 差异 将 会 以 
排序 进行 修正 ,这 就 会 成 为 受到 控制 的 一 种 差异 。 
震 想 了 解 更 多 ,请 查阅 : 希 涅 、 林 登 与 塔 达 什 (Hyine,M. ,Lyndon,J. , & 
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Quarterly ) Ж; 21 期 447 ~ 464 页 的 文章 “承诺 、 亲 密 行为 以 及 女性 对 婚前 性 
行为 和 避孕 物品 的 准备 的 认识 (Commitment, intimacy , and Women’s per- 


ceptions of premarital sex and comtraceptive readiness) 。” 


多 元 回归 


你 已 经 在 第 14 章 学 习 了 如 何 利用 一 个 变量 的 值 来 估计 另 一 个 变量 的 
值 。 通 常 社 会 科学 和 行为 科学 的 研究 者 都 使 用 不 止 一 个 变量 来 估计 另 一 
个 变量 。 我 们 在 第 5 章 和 第 14 章 都 有 所 涉及 ,这 里 更 多 地 介绍 所 谓 的 多 
元 回归 。 

例如 ,我 们 可 以 很 容易 假定 父母 读 写 方面 的 行为 (如 家 里 有 很 多 书 ) 
与 他 们 子女 读书 的 多 少 和 好 坏 有 关系 。 那 么 研究 父母 的 年 龄 .教育 水 平 、 
读 写 活动 以 及 与 子女 共同 阅读 这 些 变 量 对 子女 的 早期 语言 能 力 ,读书 兴趣 
的 影响 一 定 十 分 有 趣 。 保 拉 ，… 昌 蒂 宁 、 玛 丽 亚 - 莱 纳 - 拉克 索 与 安娜 - 迈 
УИ + ТЖ В ВЛ, £ Ят ( Раша Lyytinen, Marja-Leena Laakso, 4 Anna-Maija 
Poikkeus) 进行 了 这 方面 的 研究 ,并 使 用 逐步 回归 分 析 来 检验 父母 背景 变 
量 对 和 孩子 的 读 写 能 力 的 影响 。 他 们 发 现 母 亲 的 读 写 活动 和 母亲 的 教育 水 
乎 能 够 显著 地 影响 子女 的 语言 能 力 , 而 母亲 的 年 龄 和 共同 阅读 没有 显著 
影响 。 

是 否 想 了 解 更 多 ? ЖАСЫН Ны 拉克 索 与 波 伊 凯 乌 斯 (Lyytinen , 
P. , Laakso,M-L. & Poikkeus, A-M. ) 1998 年 发 表 在 《欧洲 教育 心理 学 杂志 》 
( European Journal of Psychology of Education) 第 3 期 297 ~ 308 页 的 文章 
“父母 对 子女 的 早期 语言 和 读书 兴趣 的 影响 (Parental contributions to 


child’s early language апа interest in books ) 。” 


因子 分 析 


”因子 分 析 是 基于 不 同 项 目的 彼此 相关 程度 并 形成 因子 或 聚 类 的 技术 。 
每 一 个 因子 代表 几 个 不 同 的 变量 ,而 在 特定 的 研究 中 对 结果 表示 方面 因子 
比 单个 变量 更 有 效 。 在 使 用 这 项 技术 的 过 程 中 , 目标 是 用 更 综合 的 名 称 如 
一 个 因子 来 描绘 彼此 相关 的 项 目 。 而 且 用 于 描述 变量 群 的 因子 的 名 称 不 
能 是 随心 所 欲 的 一 一 名 称 要 反映 内 容 和 概念 的 彼此 相关 。 

例如 ,西安 大 略 大 学 的 戴 维 - 沃 尔 夫 (David Wolfe) 和 他 的 同事 尝试 
着 去 了 解 12 岁 以 前 发 生 的 被 虐待 的 经 历 对 青少年 时 期 的 同伴 关系 和 交往 
关系 的 影响 程度 。 为 了 完成 这 项 研究 ,研究 者 收集 了 多 个 变量 的 数据 而 且 
分 析 了 所 有 变量 之 间 的 关系 。 那 些 似乎 包含 彼此 相关 项 目的 变量 被 认定 
为 因子 ,如 这 项 研究 中 名 称 为 虐待 /责备 因子 。 另 一 个 因子 的 名 称 是 积极 
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是 否 想 了 解 更 多 ? ARR: RRR, Б за 0 RR-A E- h ae 
(Жое, р. А. “Wekerle ‚С. ,Reitzel-Jaffe ,D. ,& Lefebvre, L. ) 1968 年 发 表 在 
《发 展 心 理学 》( Developmental Psychopathology) 88 10 期 61 ~ 85 页 的 文章 
受到 眶 竺 和 没有 受到 虐待 的 年 轻 人 中 间 与 消极 关系 相关 的 因子 (Factors 
associated with abusive relationships among maltreated and nonmaltreated 


youth) o” 
路 径 分 析 


这 是 分 析 相 关 的 男 一 项 统计 技术 ,但 是 在 分 析 因 素 之 间 的 关系 时 允许 
一 定 意义 上 确定 相关 的 方向 和 因果 关系 。 路 径 分 析 基 本 上 通过 变量 间 关 
系 的 理论 假定 来 分 析 关 系 的 方向 ,接着 检验 关系 的 方向 是 否 得 到 数据 的 
支持 。 

例如 , 埃 夫 克 里 德 、 帕 帕 扎 基 、 帕 帕 托尼 奥 斯 与 基 奥 赛 格 鲁 ( Efklides , 
М. Papadaki , С. Рарапіопіоив, & G. Kiosseoglou ) 人 研究 个 体 学 习 数 学 过 程 中 
对 难度 的 感知 。 为 完成 这 项 研究 ,他 们 进行 了 几 项 不 同类 型 的 测试 (如 认 
知 领域 的 那些 测试 ) 而 且 发 现 对 难度 的 感知 主要 受到 认 知 (问题 解决 ) 因 
素 而 不 是 情感 (情绪 ) 因素 的 影响 。 路 径 分 析 最 有 趣 的 应 用 之 一 是 结构 方 
程 技术 , 它 是 以 图 形 展 示 所 有 考虑 到 的 不 同 因素 之 间 关 系 的 结果 。 应 用 这 
项 技术 ,你 可 以 看 到 某 个 变量 和 某 个 变量 之 间 相 关 以 及 相关 的 强度 。 接 着 
你 就 可 以 判断 数据 与 模型 之 间 的 适合 程度 。 

是 否 想 了 解 更 多 ? 查阅 文献 : 埃 夫 克 里 德 、 帕 帕 扎 基 \ 帕 帕 托尼 奥 斯 与 
基 奥 赛 格 鲁 (Efklides ,Papadaki ,Papantonious , & Kiosseoglou)1998 ERRE 
《欧洲 教育 心理 学 杂志 》( European Journal of Psychology of Education) 第 2 
期 207 ~ 226 页 的 文章 “个 体 困 难度 感知 差异 :以 学 校 数 学 课 为 案例 (Indi- 


vidual differences іп feelings of difficulty: the case of school mathematics) ” 。 


结构 方程 模型 


结构 方程 模型 (SEM) 还 是 非常 新 的 技术 ,但 是 自从 1960 年 代 早 期 引 
入 以 来 已 经 变 得 十 分 的 流行 。 一 些 研 究 者 觉得 这 项 技术 是 回归 、 因 子 分 析 
和 路 径 分 析 的 统称 。 其 他 的 研究 者 相信 这 项 技术 本 身 代 表 着 完全 不 同 的 
方法 ,是 基于 变量 之 间 关 系 的 方法 (类 似 于 之 前 我 们 描述 的 三 项 技术 )。 

结构 方程 模型 和 其 他 高 级 统计 技术 如 因子 分 析 的 主要 差别 是 结构 方 
程 模 型 是 实证 的 ,而 不 是 解释 的 。 换 句 话 说 ,研究 者 更 多 的 使 用 结构 方程 
模型 来 确定 已 经 提出 的 模型 是 否 发 挥 功效 (也 就 是 数据 适合 模型 ) 。 解 释 
性 技术 用 于 发 现 的 关系 ,很 少 ( 不 是 没有 ) 预先 进行 模型 建构 。 


ЕЕ ИТАС ЖЕШ ИОН 


ПА 
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Kenneth Sher,& Phillip Wood) 研究 年 轻 人 的 酒精 饮用 北 乱 成 年 前 的 变量 
(人 性别 .家庭 酒精 饮用 历史 .儿童 期 的 压力 高 中 班级 的 排序 、 宗 教 背 景 、 神 
经 过 敏 症 、 个 性 外 向 、 精 神 病 史 ) 和 年 轻 人 的 发 展 任务 (完成 学 位 、 全 职工 
作 、 婚 姻 ) 之 间 的 关系 。 他 们 使 用 结构 方程 模型 技术 发 现成 年 前 的 变量 相 
比 年 轻 人 的 发 展 任务 更 为 突出 地 导致 年 轻 人 酒精 饮用 紊乱 。 
是 否 想 了 解 更 多 ? 查阅 文献 : 约 塔 姆 . 舍 尔 与 伍德 (Gotham,H.J.， 
Ѕһег, К. Ј. ,& Wood, P. K. ) 2003 年 发 表 在 《酒精 研究 杂志 》( Journal of 
Studies on Alcohol) % 64(1) 期 32 ~ 34 页 的 文章 “青年 期 的 酒精 依赖 和 发 
展 任 务 的 完成 (Alcohol involvement апа development task completion during 
young adulthood ) 。” 
е р е ота 
ма 
即使 你 近期 不 会 使 用 这 些 高 级 的 统计 过 程 , 但 是 也 有 很 多 理由 需要 你 至 少 
对 它们 有 所 了 解 , 因 为 你 肯定 会 在 不 同 的 研究 出 版 物 中 看 到 这 些 技术 被 提 到 ,或 
者 在 你 选修 的 其 他 课程 中 被 提 到 。 随 着 对 基本 的 统计 技术 (本 书 到 现在 为 止 的 
所 有 章节 ) 的 了 解 ,你 可 以 确信 你 已 经 掌握 了 大 量 的 基础 统计 学 知识 。 


统计 软件 简介 上 全 


本 章 你 会 学 到 什么 


° 介绍 可 用 于 分 析 、 绘 图 以 及 更 好 地 理解 数据 的 各 种 类 型 的 统计 软件 


在 你 努力 学 习 和 使 用 基础 统计 时 不 需要 让 自己 成 为 笨蛋 ,也 就 是 不 需 
要 了 解 并 深入 到 所 有 各 种 可 用 的 计算 机 软件 中 。 本 章 的 目的 是 大 概 介绍 
一 些 更 常用 的 统计 软件 ,包括 它们 的 特征 以 及 用 法 。 但 是 在 进行 具体 描述 
之 前 , 先 给 出 几 个 建议 。 


\ ty 


% 





选择 合适 的 统计 软件 


这 里 给 出 的 建议 经 得 起 时 间 的 检验 ,可 以 确保 你 得 到 你 想 要 的 统计 
软件 。 

1. 不 论 统计 软件 的 价格 高 昂 ( 如 SPSS) 或 相反 (类 似 EcStatic) ,在 你 购 
买 之 前 一 定 要 先 试用 。 清 单 中 的 统计 软件 几乎 都 提供 了 试用 软件 (通常 
在 它 的 网 站 给 出 ) ,你 可 以 下 载 ,而 且 在 一 些 情况 下 你 甚至 可 以 请 他 们 给 
你 邮寄 试用 版 本 的 软盘 或 者 CD。 这 些 版 本 通常 具备 全 面 的 特点 而 且 可 以 
持续 使 用 30 天 ,给 予 你 足够 的 时 间 在 购买 之 前 试用 。 

2. 既然 我 们 刚才 提 到 价格 ,直接 从 制造 商 购 买 软件 可 能 是 最 昂贵 的 方 
式 , 特 别 是 你 直接 购买 没有 要 求学 生 或 教师 折扣 (有 时 他 们 把 这 叫做 教育 
折扣 )。 你 学 校 的 书店 可 能 给 你 一 个 折扣 ,而 邮购 公司 可 能 给 你 更 好 的 折 
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扣 ( 再 一 次 要 求教 育 折扣 ) 。 你 可 以 在 大 众 计算 机 杂志 中 找到 这 些 销 售 商 
的 免费 电话 。 

3. 许多 编制 统计 分 析 软 件 的 销售 商 提供 两 种 版 本 。 一 种 是 商业 版 本 ， 
一 种 是 学 术 版 本 。 他 们 在 内 容 上 通常 都 一 样 但 是 价格 有 差异 (有 时 非常 
K) ,如 果 你 想 要 学 术 版 本 ,要 确定 这 个 版 本 和 商业 版 本 完全 相同 ,如 果 不 
相同 ,你 就 要 问 自己 是 否 可 以 忍受 这 种 差异 。 为 什么 学 术 版 本 这 么 便宜 ? 
公司 希望 ,如 果 你 是 学 生 , 等 你 毕业 之 后 ,你 就 会 进入 一 些 薪水 高 的 公司 并 
购买 完全 的 版 本 。 

4. 很 难 准确 地 知道 在 开始 之 前 需要 什么 ,但 是 一 些 软 件 包 以 模块 的 形 
式 出 现 ,而 且 你 不 需要 购买 全 部 便 可 得 到 你 工作 需要 的 统计 工具 。 阅 读 公 
司 的 宣传 手册 , 打 电 话 咨询 。 

5. 共享 软件 是 另 一 个 选择 ,而且 有 许多 这 样 的 共享 软件 。 共 享 软件 是 
分 割 软件 的 方法 ,这样 只 要 你 喜欢 你 就 可 以 购买 。 听 起 来 像 荣誉 系统 ,是 
不 是 ? 的 确 是 。 共 享 软件 价格 几乎 都 很 合理 ,通常 比 商 业 版 本 好 ;而 且 , 如 
果 你 已 经 付费 ,你 可 以 帮助 聪明 的 作者 继续 努力 开发 比 现 在 的 版 本 更 好 的 
软件 。 

б. 不 要 购买 任何 不 提供 电话 技术 支持 的 软件 ,或 者 至 少 要 有 类 似 电子 
邮件 的 联系 。 这 很 好 验证 ,拨打 技术 支持 电话 (在 你 购买 之 前 ) 来 确定 等 
待 多 长 时 间 他 们 才 接 电话 。 如 果 你 等 待 了 20 分 钟 ,这 意味 着 他 们 不 能 提 
供 足 够 的 技术 支持 来 快速 回答 使 用 者 的 问题 。 或 者 你 给 他 们 发 邮件 却 没 
有 得 到 回复 ,那么 就 考虑 其 他 软件 。 

7. 几乎 所 有 的 大 型 统计 软件 包 都 有 相同 的 功用 一 一 差别 在 于 完成 的 
方式 。 例 如 ,SPSS 、Minitab 与 JMP 在 数据 分 析 方 面 都 做 得 很 好 ,而 且 很 受 
欢迎 。 但 是 很 小 的 不 同 也 可 能 是 很 大 的 差异 。 例 如 Minitab 可 以 同时 打开 
两 个 数据 文件 而 SPSS 却 不 可 以 。 亲 自 验证 一 下 。 

8. 确定 你 的 硬件 可 以 运行 你 要 使 用 的 软件 。 例 如 ,大 多 数 软 件 不 受 限 
于 你 要 分 析 的 个 案 和 变量 的 数量 ,唯一 的 限制 通常 是 你 要 用 于 储存 数据 文 
件 的 硬件 驱动 的 大 小 。 如 果 你 的 电脑 运行 速度 很 慢 ( 不 是 奔腾 系列 ) ,而 
H. RAM( 随机 存储 器 ) 小 于 64 字 节 ,那么 你 就 可 能 要 等 待 ,在 CPU 缓慢 运 
行程 序 时 眼 巴巴 看 着 时 间 流 逝 。 在 下 载 试用 版 本 之 前 要 确定 硬件 可 以 运 
行 你 要 用 的 软件 。 同 样 要 确定 你 的 硬件 可 以 支持 Мас 操作 系统 或 Win- 
dows 操作 系统 ,并且 可 以 实现 兼容 。 


具体 介绍 


可 以 得 到 的 统计 软件 比 你 需要 的 多 。 下 面 列 出 一 些 最 流行 .特点 最 显 
着 的 软件 。 记 住 许多 软件 功用 相同 。 就 如 之 前 强调 的 ,要 尽 可 能 在 购买 前 
试用 。 
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223 27 77” 


首先 ,免费 的 部 分 


什么 也 别 做 直到 你 查阅 了 http://www. statistics. com/ content/freesoft/ 
Azlisting. htm 列 出 的 免费 软件 。 粗 略 估计 ,大 约 有 50 种 完全 免费 的 统计 
软件 包 、 试 用 版 本 或 学 生 版 本 。 我 们 不 能 评述 所 有 的 软件 ,但 是 可 以 花 点 
时 间 捣 鼓 一 下 来 确定 适应 你 需要 的 软件 。 

我 最 喜欢 的 是 哪个 软件 ? 就 是 可 用 于 Windows 和 Mac 操作 系统 的 
Webstat 3.0。 最 大 的 优点 是 什么 ? 首先 ,这 个 软件 是 免费 的 ,而 且 最 重要 
的 是 这 个 软件 由 网 站 支持 。 不 需要 下 载 软件 一 一 只 需要 “激活 ”, 就 如 
WebStat 工作 人 员 所 说 ,录入 数据 ,然后 按照 你 的 需要 进行 计算 。 令 人 印 
象 非常 深刻 ,而 且 十 分 有 趣 。 在 图 18. 1 中 你 可 以 看 到 WebStat 中 简单 描 
述 统 计 分 析 的 抓 图 。 





图 18.1 WebStat: 网 上 的 统计 学 | 


JMP 


JMP( 现 在 是 第 5 版 ) 如 广告 上 所 说 是 “统计 发 现 软 件 ”。 这 个 软件 可 
以 在 Windows 和 Мас 平台 运行 ,而 且 是 “将 统计 和 图 形 结合 在 一 起 分 析 、 
理解 和 视觉 化 数据 "的 软件 。 在 你 读 到 这 里 时 Linux 版 本 可 能 已 经 发 行 。 
JMP 的 一 个 特点 是 用 图 形 展示 每 一 个 统计 分 析 结 果 ,这样 你 总 是 可 以 看 到 
文本 和 图 形 展 示 的 两 类 分 析 结 果 。 而 且 这 是 自动 完成 的 ,不 需要 你 进行 
选择 。 

需要 更 多 的 信息 ,请 查阅 网 站 http://www. jmp. com, 

成 本 :商业 版 本 是 995 美元 ,学 术 版 本 是 450 美元 。 名 称 为 JMPIN 的 
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学 生 版 本 是 60 美元 ,可 以 从 一 个 ITP 公司 Duxberry Press 得 到 。 


Minitab 
这 是 第 一 批 可 用 于 个 人 电脑 的 软件 之 一 ,而 且 现 在 已 经 是 第 13 版 (已 


经 转 了 一 整 圈 ) 了 ,这 意味 着 可 以 看 到 这 些 年 为 了 回应 使 用 者 的 需求 而 变 
化 的 部 分 。 新 的 版 本 的 一 些 显著 特征 如 下 : 


e Project Mamager™ ,可 以 帮助 你 组 织 分 析 
e StatGuide™ ,帮助 解释 结果 

e ReportPad™ ,是 报告 产生 器 

е 在 线 指导 

e 使 用 One-Click Graphs“ 很 容易 建立 图 形 
。 具有 你 可 能 需要 使 用 的 所 有 的 分 析 技 术 





Regression Analysis: Final Score versus Test 1, Test 2 
Тһе tegression equaattan із 

Finel Score < 119 - 0.224 Test 1 - 0.227 Test 3 
Predictor 

Constant 

Test 1 

Test. 2 

5 + 12.20 R-3q += 12.4% й-54(е4)) < 0.0% 


Analysis of Varyance 


- ttt 
A 


ER 


a ГУЛИ СУЗУ СОКО А 


sss asss 
88898458888 
22885998864 


РЕГИ 


e paji 
ІНЕ 


图 18.2 Minitab 的 输出 结果 示例 ,其 中 窗口 的 底部 显示 数据 ,分 析 结 果 在 窗口 
的 上 部 显示 
在 图 18.2 中 ,你 可 以 看 到 Minitab 输出 结果 的 示例 类 似 于 相关 和 回归 
的 分 析 一 一 整洁 ` 有 序 。 
需要 更 多 的 信息 ,请 查阅 网 站 http://www. minitab. com, 
成 本 :99 美元 ,但 是 你 可 以 花费 26 美元 租用 5 个 月 ,或 者 花费 50 美元 
租用 1 年 。 试 用 版 本 可 以 用 30 天 。 


STATISTICA 


StatSoft 提供 了 用 于 Windows 和 Mac 操作 平台 的 STATISTICA 产品 的 
集合 。 这 个 强 有 力 的 软件 的 一 些 优 点 是 :自我 产生 对 话 杠 (点击 OK,STA- 
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ДРАЖ 爱 上 统计 学 
TISTICA 会 告诉 你 要 输入 什么 ) ;可 定制 的 界面 ;很 容易 和 其 他 软件 整合 ; 
STATISTICA Visual Basic 可 以 允许 你 实现 10 000 多 种 功能 ,而 且 可 以 依据 
需要 设置 新 的 功能 ;有 使 用 宏 命 令 实 现任 务 自动 化 的 能 力 。 网 站 的 一 个 优 
点 是 提供 电子 版 STATISTICA 教科 书 , 你 可 以 完整 下 载 ( 要 有 了 耐心 ,因为 可 
能 需要 30 分 钟 , 这 依赖 你 的 网 络 连接 速度 )。 

需要 更 多 的 信息 ,请 查阅 网 站 http://www. statsoftinc. com, 

成 本 :基础 版 本 是 795 美元 (有 许多 分 析 模 块 ,而 且 你 还 能 增加 ) ,学 
生 版 本 是 70 美元 (只 提供 安装 支持 ) 。 


5Р55:Мас, Windows, MS-D0S,0S/2 , UNIX , VMS. MVS-VM/CMS 


SPSS 可 能 是 现在 使 用 的 最 流行 的 一 流 的 统计 软件 包 。SPSS RAW 
盖 统 计 分 析 所 有 方面 的 不 同 的 模块 ,包括 基本 统计 和 高 级 统计 ,而 且 可 以 


在 几乎 所 有 的 操作 平台 运行 。 


11.5 版 的 新 优点 之 一 是 能 够 使 用 SPSS Tables™ ,可 按照 你 的 想法 展示 
图 表 , 而 且 也 很 容易 输出 到 其 他 的 应 用 方面 。 图 18.3 展示 的 是 SPSS 应 用 
简单 的 数据 建立 的 简单 的 图 形 。 同 样 重 要 的 特点 还 有 强 有 力 的 报告 撰 
Т) i o 





、 图 18.3 使 用 SPSS 建立 图 表 
需要 更 多 的 信息 ,请 查阅 网 站 http://www. spss. com。 
成 本 :很 贵 。Windows 完全 版 和 Мас 完全 版 (类 似 于 Windows 版 ) 是 
1 145 美 元 ,而 每 一 种 学 术 版 本 是 599 美元 。 


5ҮЗТАТ 


生物 学 和 心理 学 的 研究 者 更 常用 SYSTAT , 而 社会 科学 和 行为 科学 的 
研究 者 喜欢 SPSS( 虽然 SYSTAT 人 员 在 最 新 发 布 的 10.2 版 本 中 努力 吸引 
社会 和 行为 科学 的 研究 者 ) 。 相 对 于 其 他 软件 ,这 个 软件 可 以 在 许多 操作 
平台 使 用 ,包括 DOS, Windows, 05/2, Мас 和 UNIX , 而 且 支 持 非常 强 的 命 
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令 语 言 , 这 样 就 可 以 按照 使 用 者 的 需要 进行 分 析 。 初 学 者 可 以 使 用 这 个 软 
件 ,但 是 它 更 适合 于 高 年 级 学 生 或 专业 人 员 。 

需要 更 多 的 信息 ,请 查阅 网 站 http://www. systat. com, 

成 本 :商业 版 本 是 1 299 美元 (只 用 于 Windows 操作 系统 ) ,学 术 版 本 
是 799 美元 ,教学 版 本 是 499 美元 (以 教师 或 研究 者 身份 购买 ) 。 


STATISTIX for Windows 


STATISTIX 第 7 版 与 这 里 介绍 的 其 他 软件 功能 一 样 强大 ,而 且 还 提供 
主 莱 单 驱动 界面 ,使 得 这 个 软件 特别 容易 学 习 和 使 用 ;提供 免费 技术 支持 ; 
不 但 如 此 一 一 你 想到 这 个 没 ? 还 提供 纸 质 的 330 页 的 使 用 手册 。 而 
且 当 你 打 电 话 寻 求 技术 支持 时 ,你 可 以 和 实际 参与 的 程序 设计 人 员 谈 话 ， 
他 们 知道 在 讨论 什么 (我 的 问题 在 10 秒 内 得 到 解答 )。 图 18.4 给 出 
STATISTIX 的 两 样本 t 检验 输出 结果 。 结 果 全 面 又 清晰 。 












ЗТАТІЗТІХ - 30 DAY TRIAL VERSION 7.1 3/21/03, 8:44:52 АМ 


IO-SANPLE Т TESTS FOR SCORE БҮ GROUP 


SAMPLE 
MEAN SIZE S.D S.E 
1 6.9000 10 1.3703 0.4333 
7.1000 10 1.1972 0.3786 


2 
DIFFERENCE -0.2000 


NULL HYPOTHESIS: DIFFERENCE = 0 
ALTERNATIVE HYP: DIFFERENCE <> 0 


ASSUNPTION T DF P 95% CI FOR DIFFERENCE 

EQUAL VARIANCES -0.35 18 0.7322 (-1.4089, 1.0089) 

UNEQUAL VARIANCES -0.35 17.7 0.7323 (-1.4105, 1.0105) 
F NUM DF DEN DF P 


(575 FOR EQUALITY ------- - 
ОҒ VARIANCES 1.31 9 9 0.3470 





一 一 一 一 一 一 一 一 一 一 一 


CASES INCLUDED 20 MISSING CASES 18 


图 18.4 两 样本 均值 比较 : 检验 的 STATISTIX 输出 结果 
需要 更 多 的 信息 ,请 查阅 网 站 http://www. statistix. сот 
成 本 :商业 版 本 是 499 美元 ,学 术 版 本 是 299 美元 ,两 个 版 本 只 能 用 于 
Windows 操作 系统 。 


EcStatic 


Someware іп Vermont 的 工作 人 员 的 目标 是 “以 合理 的 价格 提供 智能 化 
便捷 型 统计 和 绘图 软件 ”。 其 实 他 们 做 得 更 多 。EsStatic 很 能 赚钱 。Es- 
Static 是 可 以 运行 的 软件 中 最 便宜 的 ,而 且 可 以 肯定 的 是 相对 于 这 里 描述 
的 大 型 软件 支付 的 费用 而 言 ,这 个 软件 物 超 所 值 。 如 果 你 认为 这 个 软件 遗 
漏 了 什么 ,看 看 下 面 列 出 的 该 软件 可 以 分 析 的 清单 : 
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• 方差 分 析 
e° 分 裂 点 
e 数值 转换 
• 相关 
e° 交互 表 和 卡 方 
e 频数 分 布 和 直方 图 
。 非 参数 统计 
e 回归 
e 散 点 图 
e 汇总 统计 
。 变量 转换 
ez 检验 
下 载 试用 版 本 体验 一 下 吧 ! 
需要 更 多 的 信息 ,请 查阅 网 站 http://www. somewareinvt. com, 
成 本 :89. 95 美元 就 可 以 下 载 ,还 可 以 得 到 10 美元 或 更 多 的 折扣 
(49.95 美 元 ) 一 一 告诉 你 的 指导 老师 。 
И с ОТО СО 
小 结 
这 是 第 区 部 分 的 最 后 一 章 , 也 应 该 是 4 爱 上 统计 学 》 的 最 后 部 分 。 但 是 还 需 
要 继续 往 下 读 。 下 一 章 介 绍 全 世界 最 好 的 10 个 统计 信息 网 址 ,接着 第 20 章 介 绍 
收集 数据 的 原则 。 两 者 之 中 都 有 乐趣 。 


ЖУ 部 分 


es 
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WART EA! 重新 启动 ! 


10 个 (或 更 多 ) 最 好 的 统计 网 址 2 


在 《 爱 上 统计 学 》 的 第 1 版 我 们 已 经 告诉 读者 ,如 果 你 还 没有 使 用 网 
络 作为 学 习 和 研究 活动 的 一 部 分 ,你 就 会 遗漏 许多 重要 的 资源 。 现 在 ,更 
多 的 学 生 、 研 究 者 以 及 其 他 人 员 肯 定 已 经 从 这 个 巨大 的 资源 中 获 益 ,但 是 
仍然 有 些 人 对 使 用 网 络 犹 殉 不 决 。 

我 们 都 已 经 认识 到 网 络 资源 不 能 弥补 学 习 或 动机 的 缺失 一 一 这 是 无 
法 弥补 的 一 一 但 是 你 表 定 可 以 找到 许多 的 信息 丰富 你 整个 的 大 学 经 验 。 
而 且 这 还 不 包括 你 在 这 个 过 程 中 能 得 到 的 乐趣 。 

因此 ,你 现在 是 统计 分 析 的 新 手 , 你 一 定 会 发 现下 面 给 出 的 网 址 十 分 
有 用 ,而 且 你 也 会 想 对 统计 学 了 解 更 多 。 一 些 是 和 以 前 相同 的 网 址 ,一 些 
完全 是 新 的 。 


v. H 


Коя 


成 堆 的 资源 


这 简直 可 以 用 矿脉 形容 。 你 可 能 需要 的 整 页 的 不 同类 型 的 统计 资源 
已 经 由 戴 维 W- 斯 托 克 伯 格 (David W. Stockburger) 教授 创造 性 地 分 类 
整理 在 网 页 http://www. psychstat. smsu. edu/dws148f/statisticsresourcesmain. 
asp 中 。 这 个 网 址 是 统计 学 网 址 中 最 好 的 。 不 要 忘掉 。 

例如 ,打开 Berrie 的 网 页 (http://www. huizen. dds. п ~ berrie) 然后 看 一 
些 特定 数据 点 变化 对 均值 和 标准 差 的 影响 的 QuickTime (短片 ,很 短 的 电 
影 ) ,或 者 查看 全 国 范 围 的 课程 指导 老师 建立 的 不 同 的 主页 ,或 者 查看 所 
有 可 以 进行 统计 分 析 的 不 同 的 软件 包 ( 在 撰写 第 18 章 时 我 就 提供 了 软件 
清单 ) 。 
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大 量 的 计算 器 


想 画 直方 图 吗 ? 随机 数 表 呢 ? 样本 规模 计算 器 呢 ? 在 http://www. 
stat. ucla. edu/ calculators/ 的 统计 计算 器 网 页 给 出 每 一 类 (超过 15 种 ) 你 可 
需要 的 计算 器 和 表格 。 足 够 帮助 你 通过 你 选修 的 统计 学 课程 ,甚至 还 绰 
绰 有 余 。 
例如 ,你 可 以 点 击 Random Permutations( 随机 排序 ) 链接 并 且 完 成 两 个 
随机 数 表 (如 图 19.1 中 所 示 的 整数 100 之 内 的 2 位 数 以 内 的 随机 排序 ) , 
你 可 以 得 到 你 想 要 的 随机 数字 。 当 你 需要 将 特定 数量 的 参与 者 分 配 到 不 
同 的 群体 中 时 就 需要 随机 数 表 ,这 时 这 样 的 计算 器 就 非常 方便 。 


Ë] 





图 19.1 产生 随机 数 集 


谁 是 谁 以 及 发 生 了 什么 


ТЕ http://www. Anselm. edu/ homepage/ jpitocch/biostatshist. html 的 His- 
tory of Statistics( 统计 学 历史 ) 网 页 中 有 著名 统计 学 家 的 肖像 和 生平 ,以 及 
他 们 在 统计 学 领域 做 出 重要 贡献 的 时 间 段 。 一 些 名 字 如 贝 努 利 ,高 尔 顿 、 
费 布 尔 和 斯 皮尔 曼 (Bernoulli ,Galton Ғізһег, & Spearman ) 是 否 引 起 你 的 好 
奇 ? 在 20 世纪 初 两 个 均值 之 间 的 首次 检验 的 发 展 状况 如 何 ? 这 似乎 有 些 
沉闷 ,但 是 你 有 机 会 阅读 关于 填补 了 统计 学 空白 的 人 的 生平 以 及 他 们 的 思 
想 一 一 总 之 ,都 是 非常 奇妙 的 思想 和 非常 奇妙 的 人 。 


都 在 这 里 


SurfStat Australia ( 在 http://www. апи. edu. au/nceph/surfstathome/su- 
frstat. html) 是 澳大利亚 纽卡斯尔 大 学 基础 统计 学 课程 的 在 线 构成 部 分 ,但 
是 其 发 展 已 经 超过 了 1987 年 最 初 的 撰写 者 安妮 特 . 多 布 森 ( Annette Dob- 
sonzai ) 提供 的 范围 ,这 些 年 安妮 扬 与 鲍 勃 . 吉 伯 德 等 人 (Anne Young, 
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Bob Gibberd) 不 断 上 传 新 的 内 容 。 在 这 些 内容 中 ,Surfstat 包含 完整 的 统计 
学 讨论 主题 。 除 了 讨论 主题 之 外 ,还 有 练习 题 ,网 上 的 统计 学 网 址 清单 ,以 
及 Java 程序 集 ( 可 以 与 其 他 不 同 的 统计 程序 共用 的 小 程序 ) 。 


超级 统计 ( HyperStat ) 


这 是 http://www. davidmlane. com/hyperstat. index. html 的 在 线 教 程 ， 
包含 18 个 课时 ,提供 了 设计 优良 \ 面 对 使 用 者 的 重要 的 基础 主题 。 我 们 喜 
欢 这 个 网 址 的 真正 原因 是 术语 ,这 些 术 语 使 用 网 络 文本 和 其 他 概念 链接 。 
例如 ,在 图 19.2 中 你 可 以 看 到 描述 统计 的 定义 和 其 他 的 术语 链接 ,如 均 
值 、 标 准 差 以 及 箱 形 图 。 点 击 其 中 任何 一 个 术语 就 会 迅速 看 到 链接 的 术 
语 。 你 会 渐 人 佳境 。 
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Descriptive statistics 
Next Section: Inferential Statistics 

important use of stanstics 15 to rummarize a collection of data 
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Graphical methods are better suited than numerical methods for 
identifying patterns in the data Numerical approaches are more 
precise and objective 





error approaches compkment each 


Е 19.2 超级 统计 屏幕 显示 范例 


数据 ,你 想 要 数据 


数据 到 处 都 是 ,只 等 着 你 去 选择 。 这 里 给 出 的 数据 很 少 。 怎 么 应 用 这 
些 数据 ? 下 载 数据 在 你 的 学 习 中 或 者 你 想 进行 的 分 析 中 使 用 ,而 且 你 还 可 
以 使 用 这 些 数据 作为 范例 。 
。 统计 索引 数据 库 (Statistical Reference Datasets ) ; http://www. itl. 
nist. gov/ div898/strd/ 
。 美 国人 口 调查 局 (这 是 个 巨大 的 数据 库 或 者 说 数据 的 金 矿 ): 
http://factfinder. census. gov/ servlet/ DataseMainpageServlet? _lang = еп 
° 拥有 大 量 数据 注解 的 “数据 和 故事 图 书馆 ”( http://lib. stat. сти. 
edu/DASL/) 。 你 可 以 查找 故事 链接 。 
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e j К ЖД РЕ (http://www. bris. ас. uk/Depts/ Есопотісѕ/ Growth/ 
datasets. htm) 的 大 量 的 经 济 数据 集 。 


还 可 以 在 联邦 政府 得 到 的 所 有 的 数据 库 。 你 交 税 支持 这 些 数据 的 提 
供 , 为 什么 不 使 用 呢 ? 例如 FEDSTATS( http://www. fedstats. gov/ ) 提供 美 
国联 邦 政府 70 多 个 机 构 收 集 计 算 的 与 公共 利益 相关 的 数据 。 联 邦 内 部 关 
于 统计 政策 的 委员 会 维护 这 个 网 址 并 为 公众 的 使 用 提供 获得 这 些 机 构 生 
成 的 全 面 的 统计 资料 和 信息 的 入 口 。 在 这 个 网 站 你 可 以 发 现 CIA 提供 的 
国家 概况 ;公立 学 校 的 学 生 教师 和 职工 的 数据 (来 自 国家 教育 统计 中 
心 ); 以 及 美国 人 口 死亡 率 图 谱 ( 来 自 国家 健康 统计 中 心 ) 。 数 据 非 常 的 
庞大 ! 


密歇根 大 学 的 网 上 统计 资源 (the University of Місһірап” в Statistics Re- 
sources on Web) ( http://www. lib. umich. edu/ govdocs/stats. html) 有 成 千 上 
万 的 资源 链接 ,包括 银行 业务 图书 出 版 .老龄 化 ,以 及 为 患 有 过 敏 症 的 人 
提供 的 花粉 数 。 浏 览 .查找 你 需要 的 准确 的 信息 一 一 不 论 是 什么 ,你 准 能 
找到 些 有 趣 的 信息 。 


容易 ,但 是 有 趣 


在 http://mathforum. org/workshops/sum96/data. collections/ datalibrary/ 
data. веб. html 上 ,你 会 找到 的 数据 包括 1994 年 的 全 国 棒球 联合 会 的 薪水 
数据 ,以 及 电视 、 医 生 或 预期 寿命 的 数据 。 不 必 感 到 惊讶 ,只 需 高 兴 地 下 载 
你 需要 的 数据 ,好 好 分 析 。 


在 斯 德 哥 尔 摩 学 习 统 计 学 如 何 


世界 范围 内 的 网 络 视 频 图 书馆 :统计 学 是 一 个 页 面 的 名 称 , 但 是 这 个 
简短 的 名 称 让 人 误解 ,因为 这 个 网 址 (来 自 佛罗里达 州立 大 学 的 研究 人 员 
建立 的 http://www. stat. ufl. edu/vlib/statistics. html) 包含 了 这 一 主题 下 各 
个 方面 的 内 容 , 具 体 包 括 数 据 资 源 、 工 作 启事 、 统 计 学 校 、 系 和 部 门 (世界 
范围 的 大 量 项 目的 描述 ) ,统计 学 研究 团体 、 机 构 和 协会 、 统 计 服 务 、 统 计 
档案 和 资源 ,统计 软件 销售 商 和 软件 、 统 计 学 杂志 、 邮 和 寄 清 单 档案 和 相关 的 
领域 。 这 里 可 以 获得 的 信息 太 多 了 。 沿 着 这 条 路 往 下 走 之 前 你 可 得 先 停 
下 来 想 想 。 
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越 来 越 多 的 资源 一 一 再 一 次 强调 


ТЕ http://www. maths. uq. edu. au/ ~ gks/webguide/ datasets. html 网 页 的 
“统计 学 "是 另 一 个 非常 容易 获得 充分 信息 和 参考 资料 的 网 址 。 在 这 里 你 可 以 
发 现 专业 组 织 ` 机 构 , 咨 询 群 体 . 出 版 物 和 出 版 商 、 统 计 学 书目 清单 .软件 的 网 
页 邮购 清单 和 讨论 群体 ,甚至 包括 统计 学 家 和 统计 学 相关 人 员 的 信息 。 


在 线 统计 学 教学 资料 


如 果 你 曾经 教授 统计 学 ,或 者 指导 过 学 生 , 这 会 是 你 想 要 浏览 的 网 址 : 
http ://noppa5. рс. Helsinki. fi/links. html。 这 个 网 址 包括 《 爱 上 统计 学 的 
每 个 主题 以 及 数 以 百 计 的 其 他 更 多 主题 的 资源 。 你 输入 名 称 就 能 查找 到 : 
回归 、Demos、 历 史 、Sila( 推论 统计 演示 ) 、 交 互 式 的 在 线 指导 、 统 计 图 .课程 
大 岗 、 教 学 资料 、 杂 志文 章 , 甚 至 包括 被 测验 者 的 信息 。 很 了 不 起 。 这 里 提 
供 的 资料 可 能 不 适合 你 在 这 个 课堂 上 的 需要 ,但 是 在 广阔 的 网 络 肯 定 能 抓 
住 对 你 有 用 的 信息 。 


越 来 越 多 的 资料 


Statistics. com( www. statistics. com) 网 站 包含 课程 、 软 件 、 统 计 方 法 、 工 
作 、 图 书 ,甚至 家 庭 作业 的 帮助 等 丰富 的 信息 。 例 如 ,如 果 你 想 了 解 免费 的 
网 络 支 持 的 统计 软件 包 , 点 击 网 页 左 侧 的 链接 。 这 是 来 自 比 尔 . 特 罗 西 莫 
(ВШ Trochim) 博 士 ( 见 图 19.3) 的 一 个 图 ,类似 于 《 爱 上 统计 学 》 第 四 部 分 
每 一 章 开始 使 用 的 流程 表 。 你 只 要 通过 回答 问题 就 会 得 到 应 该 用 什么 统 
计 技 术 进 行 分 析 的 答案 。 
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How many variables does (һе problem Involve? 
x Que Variable 
Two Маза: 
More than two vanables 





w 








19.3 选择 要 使 用 的 合适 的 统计 技术 一 一 只 须 按 照 一 定 的 方式 进行 点 击 





收集 数 据 的 10 个 原则 PZ 


现在 你 知道 的 是 如 何 分 析 数 据 ,你 还 应 该 了 解 的 是 如 何 收集 数据 。 数 
据 收 集 过 程 很 长 也 很 严格 ,即使 这 个 过 程 只 是 向 学 生 、 家 长 病人 或 选举 人 
等 不 同 群体 发 放 一 页 的 简单 问卷 。 数 据 收集 过 程 也 是 你 的 研究 项 目 中 最 
耗 时 的 部 分 。 但 是 按照 大 多 数 研究 者 所 做 的 ,收集 数据 时 期 也 可 用 于 思考 
即将 进行 的 分 析 以 及 分 析 中 的 问题 。 

这 里 给 出 10 个 原则 确保 你 依据 数据 的 用 途 收集 数据 。 与 最 初 的 10 
个 原则 不 同 , 这 些 原则 不 应 该 死记 硬 背 ( 这 些 原 则 肯定 会 发 生变 化 ) ,但 是 
如 果 你 遵循 这 些 原 则 ,就 可 以 避免 很 多 失误 。 

原则 1. 在 你 思考 研究 问题 之 初 , 也 要 开始 思考 回答 问题 需要 收集 的 
数据 类 型 。 访 谈 ? 问卷 调查 ? 纸 和 笔 ? 阅读 你 感 兴趣 的 相关 领域 的 期 刊 
了 解 过 去 其 他 人 如 何 收 集 数据 并 思考 他 们 收集 数据 的 目的 。 

原则 2. 在 思考 收集 什么 类 型 数据 的 同时 ,要 思考 从 何 处 得 到 数据 。 
如 果 是 使 用 图 书馆 获得 历史 数据 或 者 已 经 收集 完全 的 数据 的 评价 文件 ,如 
人 口 调查 数据 ( 从 美国 人 口 调查 局 获得 ,或 者 上 网 在 线 获得 ) ,你 可 能 不 会 
遇 到 什么 问题 。 但 是 如 果 你 想 评价 新 出 生 的 孩子 和 父母 之 间 的 相互 影响 
如 何 ? 教师 对 加 入 工会 的 态度 ? 刚 过 50 岁 的 人 是 否 觉 得 自己 老 了 ? 所 有 
这 些 问 题 都 需要 人 们 提供 答案 ,找到 调查 的 人 很 难 。 现 在 就 开始 。 

”原则 3. 保证 你 用 于 收集 数据 的 表格 简单 容易 。 以 飞行 员 的 数据 集 进 

行 练习 ,这 样 你 可 以 保证 从 最 初 的 记分 表 到 数据 收集 表 都 很 容易 。 

原则 4. 始终 记得 对 数据 文件 进行 备份 ,并 且 存 储 在 不 同 的 地 方 。 记 
住 有 且 只 有 两 类 人 :一 类 已 经 丢失 了 数据 , 另 一 类 将 会 丢失 数据 。 在 不 同 
的 位 置 备份 数据 收集 表 。 如 果 你 的 数据 以 电子 文档 录入 ,如 电子 表格 ,也 
确保 要 进行 备份 。 

原则 5. 不 要 依赖 他 人 收集 或 转换 数据 ,除非 你 对 他 们 进行 了 培训 ,而 
且 确 信 他 们 像 你 一 样 理解 数据 收集 过 程 。 让 他 人 帮助 你 很 好 ,而且 在 很 长 
的 收集 数据 期 间 对 保持 士气 十 分 有 帮助 。 但 是 ,除非 帮助 你 的 人 无 可 怀疑 
地 具备 这 样 的 能 力 ,否则 你 很 容易 破坏 你 所 有 的 工作 和 计划 。 

原则 6. 计划 详细 的 何 时 何 地 收集 数据 的 日 程 表 。 如 果 你 需要 参观 3 
个 学 校 而 且 每 个 学 校 有 50 个 学 生 要 分 别 进行 10 分 钟 的 测试 , 那 就 需要 25 
个 小 时 进行 测试 。 这 并 不 意味 着 你 可 以 在 日 程 表 中 为 这 项 活动 分 配 25 小 


时 。 从 一 个 学 校 到 另 一 个 学 校 的 时 间 呢 ? 如 果 轮 到 测试 的 孩子 刚好 在 卫 
生 间 而 且 你 必须 等 10 分 钟 直到 他 回 到 教室 呢 ? 你 访问 的 这 天 刚好 牛仔 鲍 
伯 是 特别 的 客人 … ,等 等 。 为 任何 可 能 做 好 准备 ,要 在 日 程 表 中 分 配 25% 
~50% 的 多 余 时 间 应 对 不 可 预测 的 事件 的 发 生 。 

原则 7. 只 要 有 可 能 就 为 你 的 项 目 培 育 可 能 的 数据 来 源 。 你 已 经 对 你 
的 学 科 知 识 有 了 一 定 的 了 解 ,那么 就 可 能 知道 谁 和 你 需要 的 类 型 的 人 一 起 
工作 或 者 谁 可 能 帮助 你 获得 这 些 样 本 。 如 果 你 是 在 大 学 社区 ,那么 就 可 能 
有 好 几 百 人 竞争 你 需要 的 相同 的 调查 样本 。 如 果 不 想 竞 争 ,为 什么 不 尝试 
在 学 校 社区 之 外 ( 大约 30 分 钟 的 距离 ) 的 社区 、 社 会 群体 .市 民 组 织 或 医 
院 调 查 ? 在 这 些 地 方 不 需 太 多 竞争 就 能 够 得 到 样本 。 

原则 8. 尽力 追踪 遗漏 了 的 测试 或 者 访谈 对 象 。 把 他 们 找 回来 并 重新 
安排 日 程 。 一 旦 你 习惯 了 跳 过 可 能 的 参与 者 ,那么 就 很 容易 将 样本 缩减 到 
更 小 规模 。 而 且 你 永远 不 能 觉察 一 一 遗漏 的 人 可 能 是 由 于 与 你 的 研究 相 
关 的 原因 而 遗漏 的 ,这 意味 着 你 最 后 的 样本 从 性 质 上 不 同 与 你 研究 开始 时 
设 定 的 样本 。 

原则 9. 永远 不 要 销毁 你 的 原始 数据 ,如 测试 手册 访谈 笔记 等 等 。 其 
他 的 研究 者 可 能 想 使 用 相同 的 数据 库 ,或 者 你 想 要 回 到 原始 数据 获得 更 多 
的 信息 。 

原则 10. 遵循 前 9 个 原则 。 这 可 不 是 开玩笑 ! 


30 分 钟 SPSS 教学 


SPSS іп Less Than 30 Minutes 





这 部 分 对 SPSS 进行 充分 的 讲解 ,让 你 可 以 完成 《4 爱 上 统计 学 》 中 的 练习 。 学 习 
SPSS 不 是 火箭 科学 一 一 需要 花费 一 些 时 间 ,按照 你 的 节奏 安排 进度 ,如 果 需 要 可 以 癌 
同学 或 教师 寻求 帮助 。 

你 可 能 很 熟悉 Windows 系统 的 其 他 应 用 软件 ,而 且 你 会 发 现 SPSS 的 许多 模块 的 
操作 非常 相似 。 我 们 可 以 假定 你 懂得 拖 动 、 点 击 、 双 击 鼠 标 ,也 会 操作 Windows 系统 。 
如 果 不 会 ,你 可 以 查阅 对 你 有 帮助 的 大 量 的 计算 机 图 书 中 的 任何 一 本 。 要 记 住 的 是 
SPSS 11.5( 在 你 读 到 这 本 书 时 第 12 版 可 能 已 经 发 布 ) 的 设计 是 用 于 Windows95/98、 
ME 以 及 XP 系统 ,而 不 能 用 于 任何 更 早 版 本 的 操作 系统 。SPSS 11. 5 很 好 地 利用 了 
Windows 的 特定 框架 结构 和 其 他 的 特点 ,如 快捷 方式 .右键 点 击 和 多 任务 操作 。 

这 部 分 是 SPSS 入 门 ,并 向 你 展示 SPSS 可 以 完成 的 任务 。 在 这 部 分 使 用 的 案例 ， 
我 们 都 使 用 附录 C 中 名 称 为 Sample Data 的 样本 数据 。 你 可 以 手动 录入 数据 或 者 从 
Sage 的 网 站 下 载 数据 ,网 址 是 http://www. sagepub. com/ salkind/ statbook/ datasets。 


启动 SPSS 


与 其 他 的 Windows 应 用 软件 一 样 ,SPSS 是 套装 软件 而 且 可 以 出 现在 开始 菜单 中 。 
在 安装 软件 时 就 建立 了 这 种 套装 软件 。 按 照 下 面 的 步骤 启动 SPSS: 

1 一 点 击 Start( 开 始 ) ,然后 点 击 Programs( 程序) 。 

2 一 点 击 SPSS 选项 。 点 击 之 后 你 就 会 看 到 如 图 Al 所 示 的 启动 窗口 。 要 注意 一 
些 计算 机 的 设置 不 同 ,SPSS 图 标 可 能 显示 在 桌面 上 。 在 这 种 情况 下 只 要 双击 图 标 就 
可 以 打开 SPSS. 


SPSS 的 打开 窗口 


就 如 图 Al 中 看 到 的 ,打开 窗口 中 显示 出 一 系列 你 可 以 选择 的 选项 :运行 SPSS Ң 
学 指导 (running the SPSS tutorial) 、 录 人 和信 数据 (entering data) .打开 已 建立 的 query ( po- 
sing ап established query ) ,使 用 数据 库 建 立 向 导 建 立新 的 query( creating а new query u- 
sing the database wizard) ,或 者 打开 现 有 的 数据 资源 (数据 文件 ) (opening an existing 
source of data) 。 如 果 你 不 想 每 次 打开 SPSS 看 到 这 个 显示 页 面 ,可 以 在 窗口 的 左下 角 
选中 Don’ t show this dialog in the future box 

根据 目的 我 们 点 击 Type in data 选项 ,因为 这 可 能 是 你 打开 和 学 习 SPSS 选择 的 第 
一 个 选项 。 点 击 之 后 就 激活 图 A2 所 示 的 Data View( 数 据 显 示 ) (或 Data Editor 数据 





图 АІ SPSS 启动 窗口 
编辑 栏 ) 窗口 。 对 数据 进行 定义 之 后 就 在 这 个 窗口 录入 你 想 应 用 SPSS 分 析 的 数据 。 
虽然 在 第 一 次 打开 SPSS 时 看 不 到 ,但 是 还 有 另 一 个 (没有 激活 的 ) 打开 窗口 。 这 就 是 


Variable view( 变 量 显示 窗口 ) ,也 就 是 定义 变量 并 设置 变量 参数 的 窗口 。 
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图 A2 ”数据 显示 窗口 
结果 观察 窗口 (Viewer) 展示 你 分 析 得 到 的 统计 结果 和 图 表 。 图 A3 所 示 是 一 个 
结果 观察 窗口 例子 。 使 用 数据 编辑 栏 建立 数据 集 , 一 旦 数据 集 经 过 分 析 并 建立 了 图 
表 , 你 就 可 以 研究 结果 观察 窗口 的 分 析 结 果 。 | 
如 果 你 认为 数据 编辑 栏 在 形式 和 功能 上 类 似 于 电子 表格 ,你 是 正确 的 。 形 式 上 的 
确 类 似 ,因为 数据 编辑 栏 包含 类 似 于 Excel 和 Lotus1-2-3 的 行 和 列 ,具体 数值 可 以 录 人 
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图 A3 ”结果 观察 窗口 
并 且 操 作 。 功 能 上 也 类 似 ,数据 编辑 栏 非常 类 似 电子 表格 。 已 经 录入 的 数据 可 以 转 
换 分类、 重新 整理 等 。 


SPSS 的 工具 栏 和 状态 栏 


使 用 工具 栏 一 一 菜单 之 下 的 图 标 集 可 以 非常 便利 地 操作 SPSS。 如 果 你 想 知 
道 工 具 栏 每 个 图 标的 含义 ,将 鼠标 指向 对 应 图 标 ,你 就 可 以 看 到 这 个 工具 可 以 做 什么 
的 解释 。 工 具 栏 中 一 些 按 钮 颜色 比较 暗 , 这 意味 着 这 些 工 具 没 有 激活 。 

状态 栏 在 SPSS 的 低 端 ,是 另 一 个 非常 有 用 的 显示 在 屏幕 上 的 工具 。 你 可 以 看 到 
SPSS 正在 进行 的 活动 的 在 线 报 告 。 状 态 栏 显 示 SPSS for Windous processor is ready 就 
是 告诉 你 SPSS 可 以 执行 你 的 命令 或 者 录入 数据 。 或 者 Running Means… 告 诉 你 SPSS 
正 处 于 名 称 为 Means 的 过 程 中 。 





使 用 SPSS 帮助 


如 果 你 需要 帮助 ,这 就 找 对 了 地 方 。SPSS 提供 帮助 ,只 要 点 击 鼠 标 就 可 以 ,而 且 
在 你 已 经 打开 数据 文件 并 且 需 要 了 解 SPSS 的 特征 时 特别 的 有 用 。SPSS 帮助 十 分 容 
易 理 解 ,即使 你 是 个 SPSS 新 手 ,也 能 很 好 地 向 你 提供 帮助 。 

你 可 以 按 功能 键 F1 得 到 SPSS 帮助 ( 见 图 A2) 或 者 使 用 图 А4 所 示 的 Help 菜单 。 

Help 菜单 中 有 8 个 选项 ,相对 于 SPSS 的 早期 版 本 来 说 是 极 大 的 扩展 ,其 中 6 个 
选项 与 给 你 提供 帮助 直接 相关 。 


e Topics 提供 你 可 以 得 到 的 帮助 的 主题 清单 。 
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A4 不 同 的 帮助 选项 
° Tutorial 提供 使 用 SPSS 的 所 有 方面 的 简短 指导 。 
。 Сазе Studies 提供 如 何 应 用 SPSS 的 真实 案例 。 
Ф Statistics Coach 让 你 按 步骤 了 解 运行 过 程 。 
• Syntax Guide 帮助 你 学 习 和 使 用 SPSS 的 命令 语言 。 
e SPSS Home Page 链接 SPSS 的 网 络 主页 。 


使 用 功能 键 Fl 


任何 时 候 需要 SPSS 的 任何 方面 的 帮助 ,可 以 使 用 快捷 、 简 易 的 方式 得 到 。 需 求 帮 
助 时 按 功能 键 Fl ,你 就 会 看 到 图 A5 所 示 的 Help 对 话 框 。 
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| Overview 


| SPSS for Windows provides a powerful statistical analysis and data management system 
| іп a graphical environment, using descriptive menus and simple dialog boxes to do most of 
| the work for you. Most tasks can be accomplished simply Бу pointing and clicking the 

| mouse. 






М 
С іп addition to the simple point-and-click interface for statistical analysis, SPSS for 
| Windows provides: 






i Data Editor. A versatilə spreadsheet-like system for defining, entering, editing, and 
| dsplaying data. 


, Viewer. Тһе Viewer makes it easy (о browse your results, selectively show апа hide 
HI output, change the display order results, and move presentation-quality tables and charts 
| between SPSS and other applications. 










| Multidimensional pivot tables. Your results come alive with multidimensional pivot 
| tables. Explore your tables by rearranging rows, columns, and layers. Uncover important 
| findings that can get lost in standard reports, Compare groups easily by splitting your 
| table so that only one group is displayed at а time. 





High-resolution graphics. High-resolution, full-color pie charts, bar charts, histograms, 
scatterplots, 3-D graphics, and more are included as standard features in SPSS. 















| Database access. Retrieve information from databases by using the Database Wizard 
instead of complicated SQL queries. 





| Doto tronsformations, Transformation features help get your data ready for analysis. 
| You сап easily subset data, combina categories, add, aggregate, тегде, split, and 
| transpose files, and more. 





Electronic distribution. Send e-mail reports to others with the click of è button, or 
ЕҢ А5 SPSS 帮助 
内 容 表 (The contents tab) 


内 容 表 描述 所 有 帮助 的 大 标题 。 双 击 任何 一 个 大 标题 就 会 提供 一 个 你 可 能 需 
要 咨询 或 求助 的 主题 清单 。SPSS Help 中 的 索引 表 提 供 按 字母 排序 的 帮助 主题 。 搜 
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索 表 人 允许 你 键入 可 能 出 现在 帮助 页 面 中 的 任何 单词 。 接 着 SPSS 搜索 这 个 单词 ,而 
不 是 仅仅 提供 一 个 主题 的 帮助 。 实 际 上 ,你 在 搜索 所 有 主题 中 的 所 有 的 这 一 单词 ， 
最 后 帮助 菜单 的 常用 项 ( Favorites) 可 以 让 你 将 你 认为 需要 返回 去 获得 更 多 帮助 的 
主题 区 别 开 来 。 这 也 是 储存 你 常用 的 帮助 主题 的 一 种 方式 ,这 样 你 可 以 很 快 获得 相 
同 主题 的 帮助 。 


SPSS 的 简短 旅程 


现在 坐 好 了 ,享受 SPSS 提供 的 简单 旅程 。 这 里 没有 任何 想象 。 只 是 一 些 简单 的 
数据 描述 .显著 性 检验 以 及 一 个 或 两 个 图 表 。 我 们 尽力 向 你 们 展示 的 是 SPSS 的 使 用 
是 多 么 的 容易 。 


”打开 一 个 数据 文件 


你 可 以 录入 自己 的 数据 建立 新 的 SPSS 数据 文件 ,使 用 现 有 的 文件 ,甚至 将 其 他 应 
用 软件 如 Microsoft Excel 的 数据 转换 为 SPSS 数据 文件 。 无 论 你 采用 哪 种 方式 ,你 需要 
数据 。 在 图 Аб 中 显示 的 是 附录 С 中 名 称 为 样本 数据 (Sample Data) 的 数据 文件 ,这 些 
数据 也 可 以 从 网 上 下 载 。 
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图 A6 ”打开 的 SPSS 数据 文件 
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简单 的 图 和 表 





首先 ,假定 我 们 想 知道 男性 和 女性 的 总 体 分 布 。 这 仅仅 是 我 们 分 析 的 总 体 样 本 中 
男性 女性 各 有 多 少 的 计数 问题 。 我 们 还 想 建 立 一 个 简单 的 分 布 条 形 图 。 

在 图 A7 中 ,你 会 看 到 输出 结果 中 给 出 了 我 们 需要 的 准确 的 信息 ;也 就 是 男性 和 
女性 的 频数 。 我 们 使 用 Descriptive Statistics( 在 Analyze 主 菜单 下 ) 中 的 下 requencies 3% 
ЖАЛАА. ЕР Grophs 选项 建立 频数 的 简单 的 条 形 图 ,如 图 А7 бга 


ашшы жа асы әј ај 11; 
2121121210) sials] 


з 





图 A7 简单 描述 分 析 的 结果 
简单 分 析 


我 们 想 分 析 男 性 和 女性 的 testl 的 平均 成 绩 是 否 不 同 。 这 是 需要 独立 样本 1 检验 
的 简单 分 析 。 分 析 过 程 就 是 比较 男性 和 女性 的 testl 的 成 绩 均 值 。 

图 Ag 中 所 见 就 是 上 检验 的 部 分 结果 。 注 意 在 SPSS 观察 结果 窗口 (Viewer) 的 左 
侧 方 框 内 列 出 的 条 目 是 Frequencies .Graph 和 t-test 过 程 。 我 们 想 看 其 中 任何 一 个 部 
分 ,所 有 需要 做 的 是 点 击 相应 的 条 目 。 一 般 来 说 SPSS 在 观察 结果 窗口 中 产生 输出 结 
ЖЕН ,你 需要 滑动 鼠标 才能 看 到 全 部 结果 。 


建立 和 编辑 数据 文件 


为 便于 练习 我 们 建立 附录 C 中 所 见 的 Sample Data 文件 。 第 一 步 是 定义 数据 集中 
的 变量 ,接着 录入 数据 。 现 在 打开 新 的 数据 编辑 窗口 (点 击 File INew—Data) 。 


定义 变量 
不 定义 变量 SPSS 不 能 工作 。 你 可 以 让 SPSS 为 你 定义 变量 ,或 者 你 自己 定义 ,这 
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图 АВ ”独立 样本 :检验 的 输出 结果 
样 就 可 以 更 好 地 控制 变量 显示 或 运行 的 方式 。SPSS 自动 将 第 一 个 变量 命名 为 
VAR00001。 如 果 你 在 第 1 行 第 5 列 定义 一 个 变量 , SPSS 会 将 这 个 变量 命名 为 


VAR00005 ,而 且 按 次 序 命名 其 他 列 的 变量 。 但 是 你 也 可 以 自己 定义 变量 ,使 用 你 确定 
的 名 称 。 


自己 定义 变量 :使 用 变量 显示 窗口 (Variable View window) 


要 定义 变量 ,必须 首先 进入 变量 显示 和 窗口, 点击 SPSS 显示 窗口 底部 的 Variable 
View 栏 就 可 以 进入 。 点 击 之 后 就 看 到 图 A9 所 示 的 变量 显示 窗口 ,也 就 可 以 定义 任何 
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图 A9 变量 显示 窗口 
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一 个 你 认为 适合 的 变量 。 

一 旦 进入 变量 显示 窗口 ,你 可 以 按照 下 面 的 参数 定义 变量 : 

Name 提供 最 多 8 个 字 节 的 变量 名 。 

Туре 定义 变量 的 类 型 ,如 text 数值 型 字符 串 .科学 计数 等 等 。 

Width 定义 变量 所 占据 的 列 的 数字 字符 的 字 节 数 。 

Decimals 定义 在 数据 显示 栏 (Data View) 中 显示 的 小 数 点 的 位 数 。 

Label 定义 最 多 256 个 字 节 的 变量 的 标签 。 

Value 定义 特定 的 数值 对 应 的 标签 (如 1 为 男性 ,2 为 女性 ) 。 

Missing 表示 如 何 处 理 缺 失 的 数据 。 

Columns 定义 数据 显示 窗口 (Data View window) 中 变量 分 配 的 空间 的 数量 。 

Align 定义 数据 在 每 一 格 中 如 何 显示 ( 左 对 齐 、 右 对 齐 或 居中 )。 

Measure 定义 最 好 的 描述 变量 特征 的 测量 尺度 ( 定 类 、 定 序 或 定 距 )。 

把 光标 置 于 Name( 名 称 ) 列 的 第 一 格 , 然 后 键入 任何 名 称 , 并 且 按 Enter 键 ,然后 
SPSS 将 自动 提供 变量 所 有 特征 的 默认 值 。 如 果 是 在 数据 显示 窗口 (点 击 窗口 底部 的 
按钮 ) 键 人 数据 ,SPSS 将 自动 命名 变量 为 VAR00001 、VAR00002 VAR00003 等 。 

在 变量 显示 窗口 键入 图 A10 中 所 示 的 变量 的 名 称 。 


Ble йз Yie Dete Ironstor шуш барыа Militier Шм elp 


rE ERCE 4: |1 АИГ Ql 
| Nene | Tp wan ою] 










None None Right Ordinal 
None None Right Ordinal 
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图 A10 在 变量 显示 窗口 定义 变量 
| 现在 你 就 可 以 切换 到 Data View( 数 据 显示 窗口 )( 见 图 All ) ,接着 录 人 图 A6 所 
示 的 数据 。 不 过 ,首先 让 我 们 来 看 一 下 没有 录 人 数据 的 空白 的 Data View, 
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ШАП 可 以 进行 数据 录入 的 已 经 定义 了 变量 的 数据 显示 窗口 


定义 变量 标签 

你 可 以 在 SPSS Data Editor 让 数据 以 数值 出 现 ,或 者 以 标签 表示 数值 (如 图 A6 
所 见 ) 。 

为 什么 你 想 改变 变量 的 标签 ? 可 能 是 你 已 经 知道 改变 标签 在 总 体 上 使 得 对 数值 
《如 1 或 2) 的 处 理 比 对 字符 串 或 文字 数字 的 变量 (如 男性 或 女性 ) 的 处 理 更 有 意义 。 

但 是 看 文字 比 看 数字 更 容易 了 解数 据 文件 。 考 虑 一 下 以 数字 表示 变量 水 平 (如 1 
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和 2) 的 数据 文件 与 以 实际 标签 值 ( 如 男性 和 女性 ) 表 示 的 数据 文件 之 间 的 差异 。 变 量 
显示 窗口 的 values 选项 可 以 让 你 在 每 一 格 键入 变量 值 , 但 是 你 看 到 的 是 变量 值 的 


标签 。 
WR Values 列 ( 见 图 A12) 点击 省 略 号 按钮 ,你 就 会 看 到 如 图 A13 所 示 的 Value 


对 话 框 。 
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图 A13 ”变量 值 标签 对 话 框 
改变 变量 标签 


按照 下 面 的 步骤 分 配 或 改变 变量 标签 。 这 里 我 们 定义 男性 对 应 的 标签 值 为 1, 女 
性 的 标签 值 为 2。 

І. 对 性 别 变 量 来 说 ,点 击 省 略 号 ( 见 图 A12) 打 开 Value Labels 对 话 框 。 

2. 键入 变量 的 一 个 数值 ,在 这 个 案例 中 就 是 1 为 male。 

3. 键入 变量 值 对 应 的 标签 ,也 就 是 male。 

4. 点 击 Add, 

5. 同样 的 过 程 定义 2 的 标签 为 female。 在 完成 定义 标签 的 对 话 框 的 任务 ( 见 图 
А14) ,点 击 OK ,新 的 标签 就 会 显现 。 


Value Labels 


P- emale" 


anae 


Мс Jz 
НИДА 





图 А14 完成 的 变量 值 标 签 对 话 框 
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如 果 从 主 菜单 选择 View 一 Variable Labels , 你 会 在 数据 显示 窗口 看 到 标签 ,如 图 
А15 所 示 。 要 注意 的 是 图 А15 中 对 应 格 实际 上 键入 的 值 是 2, 即 使 格 中 显示 的 标签 是 
Female 


=J Sample Data Set - SPSS Data Editor 


Female E — Exp 


Male Exp 
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В А15 显示 变量 标签 
打开 数据 文件 


一 旦 文件 保存 之 后 ,就 必须 在 再 次 使 用 时 打开 或 回 到 这 个 文件 。 这 个 过 程 很 
简单 。 

1. 点 击 File 一 Open。 你 会 看 到 Open Data File. 对 话 框 。 

2. 找到 你 想 打 开 的 数据 文件 ,然后 选中 。 

3. 点 击 OK。 

快速 找到 并 打开 SPSS 文件 的 方式 是 在 File 菜单 的 底部 直接 点 击 文件 的 名 称 。 
SPSS 会 在 File 菜单 列 出 最 近 使 用 的 文件 。 


SPSS 与 打印 过 程 . 


现在 介绍 数据 文件 建立 之 后 你 要 完成 的 最 后 一 件 事 。 建 立 了 你 想 建 立 的 文件 ,或 
者 完成 了 某 类 分 析 或 图 表 , 你 可 能 会 为 了 安全 的 保存 或 者 在 报告 或 文章 中 引用 而 需要 
打印 出 一 份 纸 质 复 件 。 那 么 , 当 SPSS 文件 已 经 打印 好 ,而 且 你 也 想 结束 工作 时 ,就 是 
退出 SPSS 的 时 候 了 。 

打印 过 程 和 编辑 和 保存 过 程 一 样 重要 。 如 果 不 能 打印 ,你 就 不 能 取得 这 个 阶段 的 
任何 结果 。 你 可 以 将 SPSS 的 数据 文件 转换 到 其 他 的 应 用 软件 中 ,但 是 从 SPSS 直接 获 
得 打印 件 通常 来 说 更 省 时 也 更 为 重要 。 


打印 SPSS 数据 文件 


不 论 是 打印 整个 数据 文件 或 者 只 是 其 中 的 一 部 分 ,打印 过 程 都 很 简单 。 

1. 确定 你 想 打印 的 数据 文件 在 激活 窗口 中 。 

2. 点 击 File 一 Print。 结 果 就 是 你 看 到 的 Print 对 话 框 。 

3. 点 击 OK ,任何 激活 状态 的 内 容 都 会 被 打印 出 来 。 

就 如 你 看 到 的 ,你 可 以 选择 打印 整个 文件 或 者 一 个 特定 的 部 分 (你 已 经 在 数据 编 
辑 窗 口 做 了 选择 ) ,也 可 以 选择 增加 打印 的 复 件数 量 , 也 就 从 1 到 99(99 是 最 大 的 可 
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以 打印 的 复 件 数量 ) 。 
打印 SPSS 数据 文件 的 一 部 分 


打印 数据 文件 的 一 部 分 的 步骤 和 上 面 列 出 的 打印 整个 数据 文件 的 步骤 一 样 , 只 是 
在 数据 编辑 窗口 你 选择 了 你 想 打印 的 部 分 并 且 在 Print 对 话 框 选择 了 Selection 选项 。 
步骤 如 下 : 

1. 确定 选择 了 你 想 打印 的 数据 文件 。 

2. 点 击 File 一 Print。 | 

3. 在 Print 对 话 框 点 击 Selection, 

4. 点 击 OK ,任何 你 选择 的 内 容 都 会 被 打印 出 来 。 


建立 SPSS 图 表 


一 幅 图 胜 过 千言 万 语 ,而 且 SPSS 具备 建立 图 表 的 模块 ,可 以 使 分 析 结 果 生 动 地 体 
ЭҤ Ж ХЕЙ A 部 分 ,我 们 会 逐步 介绍 几 种 不 同 图 表 的 建立 过 程 并 提供 不 同 图 表 
的 案例 。 接 着 我 们 会 展示 如 何 调整 图 表 , 包 括 添 加 图 表 的 标题 、 数 轴 的 标签 ,调整 大 
小 ,调整 字体 和 格式 等 等 。 需 要 注意 一 下 ,SPSS 中 “图 (graphs)”“ 表 (charts) ”两 个 词 
代表 的 意思 差不多 。 


建立 简单 的 图 表 


所 有 图 表 的 一 个 共同 点 是 图 表 的 建立 都 是 基于 数据 的 。 你 可 能 会 输入 数据 建立 
图 表 ,但 是 在 这 里 的 案例 中 我 们 使 用 附录 C 的 数据 建立 每 个 群体 中 男性 数量 和 女性 
数量 的 条 形 图 ( 如 图 А7 中 所 示 ) 。 


建立 条 形 图 


建立 任何 图 表 的 步骤 基本 上 都 相同 。 首 先 录 入 用 于 建立 图 表 的 数据 ,接着 从 
Graphs 菜单 中 选择 你 想 建 立 的 图 表 的 类 型 ,然后 定义 图 表 呈 现 的 形式 ,最 后 点 击 OK。 
下 面 是 建立 图 A7 所 示 图 表 的 步骤 。 

1. 录入 用 于 建立 图 表 的 数据 。 

2. Aii Graphs 一 Bar。 之 后 你 就 会 看 到 图 A16 所 示 的 Bar Charts 对 话 框 。 

3. 点 击 Simple。 

4. 点 击 Summaries for groups of cases。 

5. 点 击 Define。 之 后 你 就 会 看 到 Define Simple Bar: Summaries for Groups of Cases 
对 话 框 。 

6. 点 击 Cum n of cases。 

7. 点 击 gender ,接着 点 击 P> 将 变量 移 到 Category Axis 框 中 。 

8. 点 击 OK ,你 就 会 看 到 如 图 А17 所 示 的 条 形 图 。 


保存 图 表 


图 表 不 是 输出 窗口 的 唯一 构成 。 图 表 是 执行 一 定 类 型 的 分 析 所 产生 的 结果 的 一 
部 分 。 图 表 不 是 只 代表 自身 的 独立 的 部 分 ,也 不 能 就 这 样 保存 。 要 保存 图 表 , 你 需要 
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Bar Charts 





图 A16 条 形 图 对 话 框 


GENDER 





图 A17 简单 的 条 形 图 
保存 结果 观察 窗口 的 所 有 内 容 。 可 以 按照 下 面 的 步骤 进行 : 
1. 点 击 File—Save 
2. 给 结果 观察 窗口 命名 。 
3. 点 击 OK。 输 出 结果 就 会 保存 在 你 提供 的 名 称 之 下 ,扩展 名 是 . spo 


修饰 SPSS 图 表 


一 旦 建立 我 们 在 之 前 所 示 的 图 表 , 你 可 以 通过 编辑 图 表 来 准确 地 反映 你 想 表达 的 
内 容 。 颜 色 、 形 状 、 规 模 、 字 体 等 都 可 以 改变 。 我 们 以 最 早 在 图 A7 中 所 示 的 条 形 图 来 
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说 明 。 
编辑 图 表 


编辑 图 表 的 第 一 步 就 是 双击 图 标 ,然后 点 击 最 大 化 按钮 。 你 就 会 在 图 А18 中 所 
示 的 图 表 编 辑 窗口 (Chart Editor Window ) 看 到 整个 图 表 。 





А18 图 表 编 辑 窗口 
修改 总 标题 和 次 级 标题 


我 们 的 第 一 个 任务 是 给 图 А17 中 所 示 的 图 表 键 入 总 标题 和 次 级 标题 。 
1. 点 击 Chart 一 "Titles ,你 就 会 看 到 图 А19 所 示 的 Titles 对 话 框 。 





图 A19 ”标题 对 话 框 
2. 在 标题 1 部 分 键入 Frequency of Gender, 
3. 按 功能 键 Tab 将 光标 移 到 Subtitle 文本 框 。 
4. 键入 Draft Chart, 
5. 从 总 标题 和 次 级 标题 的 Justification 的 下 拉 菜 单 中 选择 Center, 
6. 点 击 OK。 
总 标题 和 次 级 标题 会 在 图 中 出 现 。 如 果 你 想 编辑 总 标题 或 次 级 标题 ,首先 要 确定 
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图 是 处 于 激活 状态 ,然后 选择 Chart 一 "Titles。 


修饰 字体 


现在 开始 编辑 图 中 用 于 表示 所 有 文本 内 容 的 字体 。 你 可 以 采用 两 种 方式 来 完成 ， 
每 种 方式 都 使 用 相同 的 对 话 框 。 

1. 选择 包含 你 想 改变 字体 的 图 表 区 域 。 选 择 了 文本 之 后 就 会 在 其 周转 出 现实 线 。 

2. 选择 新 的 字体 和 大 小 ,你 可 以 (a) 选 择 Format 一 "Text ,或 者 (b) 点击 Text 按钮 。 


修饰 坐标 轴 


x 轴 和 y 轴 为 独立 变量 (通常 是 x 轴 ) 和 依赖 变量 (通常 是 y 轴 ) 提供 刻度 。SPSS 
Ki y 轴 称 为 刻度 轴 ,x 轴 称 为 分 类 轴 。 每 个 数 轴 都 能 够 以 不 同 的 方式 调整 。 双 击 数 轴 
的 标题 就 可 以 进行 调整 。 

如 何 调 整 刻 度 (y) 轴 ? 

按照 下 面 的 步骤 调整 y 轴 ， | 

1. 双击 y 轴 的 标题 。 之 后 你 就 会 看 到 如 图 A20 所 示 的 Scale Axis 对 话 框 。 

2. 从 Scale Axis 对 话 框 选择 你 想 修改 的 选项 。 

我 们 进行 了 这 样 的 修改 ; 

将 y 轴 标 题 cumulative frequency 改 为 Number, 

у 轴 的 标题 改 为 居中 。 


Scale Axis 





图 А20 ”刻度 轴 对 话 框 
我 们 还 可 以 进行 其 他 修改 ,如 改变 刻度 的 范围 ,改变 主要 刻度 单位 和 最 小 刻度 
单位 。 
如 何 调 整 分 类 (x) 轴 ? 
调整 x 轴 和 调整 у 轴 一 样 容易 。 
按照 下 面 的 步骤 调整 ; 
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1. 双击 x 轴 的 标题 就 打开 Category Axis 对 话 框 。 这 个 对 话 框 和 图 А20 中 看 到 的 
对 话 框 非常 类 似 。 

2. 从 Category Axis 对 话 框 选择 你 想 修 改 的 选项 。 

我 们 进行 了 这 样 的 修改 : 

将 x 轴 标 题 GENDER 改 为 Gender。 

x 轴 的 标题 改 为 居中 。 

完成 这 些 修改 之 后 的 图 类 似 于 图 A21 所 示 ,然后 通过 双击 窗口 图 标 或 选择 File 一 > 
Close 关闭 图 表 编 辑 窗口 。 


Graph 


Frequency of Gender 









Gender 


图 А21 修改 后 的 简单 的 条 形 图 
描述 数据 


现在 你 对 于 如 何在 SPSS 中 建立 数据 文件 已 经 有 了 一 定 的 了 解 。 接 下 来 我 们 举例 
学 习 简 单 的 分 析 。 


频数 和 交互 表 


频数 简单 地 计算 特定 数值 出 现 的 次 数 。 交 互 表 可 以 计算 一 个 数值 在 一 个 或 多 个 
分 类 维度 上 出 现 的 次 数 , 如 性 别 和 年 龄 。 频 数 和 交互 表 一 般 都 出 现 研究 报告 中 , 因为 
两 者 给 出 数据 的 总 体 描 述 。 按 照 下 面 的 步骤 计算 频数 。 首 先 你 应 该 进入 数据 编辑 
窗口 。 

1. 点 击 Analyze 一 Descriptive Statistics 一 "Frequencies。 之 后 你 就 会 看 到 如 图 А22 所 
Ж.Н) Frequencies 对 话 框 。 

2. 双击 想 要 进行 频数 计算 的 变量 。 在 这 个 案例 中 是 Testl 与 Test2。 

3. 点 击 Statistics。 你 就 会 看 到 如 图 А23 所 示 的 Frequencies : Statistics 对 话 框 。 

4. Æ Dispersion 部 分 ,选择 Std. deviation, 
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` Frequencies 


PIGAIN 





图 A23 频数 :统计 对 话 框 
5. 在 Central Tendency 部 分 ,选择 Mean 。 
6. 点 击 Continue, 
T-A ОК, 
输出 结果 包括 testl 和 test2 的 频数 清单 ,以 及 每 个 值 的 汇总 统计 (均值 和 标准 
差 ) ,如 图 А24 所 示 。 


应 用 独立 样本 1 检验 


独立 样本 :检验 用 于 分 析 来 自 不 同类 型 的 研究 的 数据 ,包括 试验 、 准 试验 和 田野 
调查 数据 ,就 像 下 面 案例 中 所 示 的 数据 这 样 的 ,这 个 例子 中 我 们 检验 男性 和 女性 在 阅 
读 方面 存在 差异 的 假设 。 
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图 А24 testl 与 test2 的 汇总 统计 


如 何 执行 独立 样本 上 检验 

按照 下 面 的 步骤 执行 独立 样本 上 检验 : 

1 一 点 击 Analyze 一 Compare Means 一 ,接着 点 击 Independent-Sample t Test。 之 后 你 
就 会 看 到 如 图 А25 所 示 的 Independent-Sample t Test 对 话 框 。 


‘ Independent-Samples Т Test 





А25 ”独立 样本 上 检验 对 话 框 


独立 样本 上 检验 对 话 框 


在 对 话 框 的 左 侧 你 会 看 到 可 用 于 分 析 的 所 有 变量 的 清单 。 现 在 你 需要 做 的 就 是 
定义 检验 变量 和 分 组 变量 。 

2 一 点 击 testl ,然后 点 击 Test Variable(s) 框 的 mo 将 变量 移 人 Test Variable(s) 框 。 

3 一 点 击 gender, 然后 点 击 Grouping Variable ЖЕНУ» 3 15 ht £ A Grouping 

Variable 框 。 

4 一 点 击 Define Groups。 

5 一 在 Croupl 键入 1。 

6 一 在 Group2 #Ë À 2. 

7 一 点 击 Continue。 
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8 一 点 击 OK. 
输出 结果 包括 每 个 变量 的 均值 .标准 差 , 以 及 1 检验 的 结果 ,如 图 A26 所 示 。 





图 A26 简单 1 检验 的 输出 结果 
我 们 对 SPSS 进行 了 最 简单 的 介绍 ,而 且 如 果 你 不 了 解 最 初 建立 的 数据 的 值 和 意 
义 , 那 么 这 些 技能 肯定 没有 任何 用 处 。 因 此 不 要 受到 他 人 使 用 类 似 SPSS 的 软件 的 技 
能 影响 ,而 是 要 更 多 地 关注 那些 能 够 告诉 你 输出 结果 的 含义 以 及 如 何 反映 你 最 初 的 问 
题 的 人 。 如 果 自 己 就 能 完成 那 就 更 好 了 。 


退出 SPSS 
退出 SPSS 点 击 File 一 Exit 就 行 。SPSS 会 确保 你 有 机 会 保存 任何 没有 保存 或 已 经 


编辑 过 了 的 文件 ,然后 才 退 出 。 
好 啦 , 你 的 学 习 已 经 结束 。 


数据 表 
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ЗЕ Bl1 : 正 态 曲线 下 的 面积 


如 何 使 用 这 个 表 : 

1. 依据 样本 的 原始 数值 和 均值 计算 z 值 。 

2. 依据 正确 的 z 值 确定 正 态 曲线 下 面积 的 百分比 或 者 确定 均值 和 计算 的 = 
值 之 间 面 积 的 百分比 。 


Ж B2 :拒绝 零 假 设 需要 的 上 值 


如 何 使 用 这 个 表 : 

І. 计算 检验 统计 量 : 值 。 

2. 比较 实际 值 t 值 和 这 个 表 中 的 临界 值 。 确 定 你 正确 地 计算 了 自由 度 ,而 且 选 择 
了 合适 的 显著 水 平 。 

3. 如 果实 际 值 大 于 临界 值 或 这 个 表 中 的 值 , 零 假设 (均值 相等 ) 不 是 观察 到 的 任 
何 差异 的 最 有 力 解释 。 

4. 如 果实 际 值 小 于 临界 值 或 这 个 表 中 的 值 , 零 假设 就 是 观察 到 的 任何 差异 的 最 有 
力 解 释 。 


Ж B3: 方 差分 析 或 者 检验 的 临界 值 


1. 计算 下 值 。 

2. 计算 分 子 的 自由 度 ( 丰 -1) ,分 母 的 自由 度 (n — k) 。 

3. 依据 分 子 自由 度 和 分 母 自由 度 交 错 的 位 置 确定 临界 值 。 临 界 值 就 是 行 和 列 交 
错位 置 的 值 。 

4. 如 果实 际 值 大 于 临界 值 或 这 个 表 中 的 值 , 零 假设 (均值 彼此 相等 ) 不 是 观察 到 
的 任何 差异 的 最 有 力 解释 。 

5. 如 果实 际 值 小 于 临界 值 或 这 个 表 中 的 值 , 零 假 设 就 是 观察 到 的 任何 差异 的 最 有 
力 解 释 。 


表 B4 :拒绝 零 假 设 需要 的 相关 系数 值 


如 何 使 用 这 个 表 : 
1. 计算 相关 系数 值 。 
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2. 比较 相关 系数 值 和 这 个 表 中 的 临界 值 。 

3. 如 果实 际 值 大 于 临界 值 或 这 个 表 中 的 值 , 零 假设 ( 相关 系数 等 于 0) 不 是 观察 到 
的 任何 差异 的 最 有 力 解释 。 

4. 如 果实 际 值 小 于 临界 值 或 这 个 表 中 的 值 , 零 假 设 就 是 观察 到 的 任何 差异 的 最 有 
力 解释 。 


Ж B5 : 卡 方 检验 的 临界 值 


如 何 使 用 这 个 表 : 

1. 计算 x 值 。 

2. 计算 行 的 自由 度 (R -1) 和 列 的 自由 度 (C -1)。 如 果 是 一 维 表 ,就 只 有 列 的 自 
由 度 。 

3. 依据 标题 为 (dp) 列 的 自 由 度 和 合适 的 显著 水 平 所 在 的 列 确定 对 应 的 临界 值 。 

4. 如 果实 际 值 大 于 临界 值 或 这 个 表 中 的 值 , 零 假 设 (频数 彼此 相等 ) 不 是 观察 到 
的 任何 差异 的 最 有 力 解释 。 

5. 如 果实 际 值 小 于 临界 值 或 这 个 表 中 的 值 ， 零 假 设 就 是 观察 到 的 任何 差异 的 最 有 
力 解 释 。 
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表 B.2 拒绝 零 假设 需要 的 1 值 


单 侧 检验 双 侧 检验 

df .10 .05 .01 df .10 .05 .01 
1 3.078 6.314 31. 821 1 6.314 12.706 63. 657 
2 1. 886 2.92 6. 965 2 2.92 4. 303 9.925 
3 1. 638 2.353 4.541 3 2,252 3.182 5.841 
1 1.533 2.132 3.747 + 2.132 2.776 4. 604 
5 1.476 2.015 3. 365 5 2.015 2. 571 4.032 
6 1.44 1.943 3.143 6 1.943 2.447 3.708 
4 1.415 1.895 2.998 1 1.895 2. 365 25 
8 1. 397 1.86 2.897 8 1.86 2.306 3.356 
9 1.383 1.833 2.822 9 1.833 2.262 , 2,25 
10 1.372 1.813 2.764 10 1.813 2.228 3.17 
11 1.364 1.796 2.718 11 1.796 2.201 3.106 
12 1.356 1.783 2.681 12 1.783 2.179 3.055 
13 1.35 1.771 2.651 13 1.771 2.161 3.013 
14 1.345 1. 762 2.625 14 1. 762 2. 145 2.977 
15 1. 341 1. 753 2.603 15 1. 753 2. 132 2.947 
16 1.337 1. 746 2. 584 16 1. 746 2.12 2.921 
17 1.334 1. 74 2.567 17 1. 74 2.11 2. 898 
18 1. 331 1. 734 2.593 18 1. 734 2. 101 2.879 
19 1. 328 1. 729 2.54 19 1.729 2.093 2.861 
20 1.326 1.725 2.528 20 1, 725 2.086 2.846 
21 1.323 1.721 2.518 21 1.721 2.08 2.832 
22 1.321 1.717. 2.509 22 1.717 2.074 2.819 
23 1.32 1.714 2.5 23 1.714 2.069 2.808 
24 1.318 1.711 2.492 24 1.711 2.064 2.797 
25 1,217 1.708 2.485 25 1.708 2.06 2.788 
26 1.315 1.706 2.479 26 1.706 2.056 2719 
27 1.314 1. 704 2.473 27 1. 704 2.052 2.771 
28 1.313 1.701 2.467 28 1.701 2.049 2.764 
29 1.312 1. 699 2.462 29 1. 699 2.045 2.757 
30 1.311 1. 698 2.458 30 1. 698 2.043 2.79 
35 1.306 1.69 2.438 35 1.69 2.03 2.724 
40 1. 303 1. 684 2.424 40 1. 684 2.021 2. 705 
45 1.301 1.68 2.412 ° 45 1.68 2.014 2.69 
50 1.299 1.676 2.404 50 1.676 2.009 2.678 
55 1.297 1.673 2.396 55 1.673 2.004 2.668 
60 1. 296 1.671 2. 39 60 1.671 2.001 2.661 
65 1. 295 1.669 2. 385 65 1. 669 1. 997 2.654 
70 1. 294 1. 667 2.381 70 1. 667 1. 995 2.648 
75 1. 293 1.666 2.371 75 1.666 1.992 2.643 
80 1.292 1. 664 2.374 80 1. 664 1.99 2.639 
85 1.292 1. 663 2.371 85 1. 663 1.989 2.635 
90 1. 291 1.662 2.369 90 1.662 1.987 2.632 
95 1. 291 1.661 2.366 95 1.661 1.986 2.629 
100 1.29 1.66 2.364 100 1.66 1.984 2.626 


Infinity 1.282 1. 645 2.327 Infinity 1.645 1.96 2.576 
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表 B.3 方差 分 析 或 卫 检 验 的 临界 值 
分 子 自 由 度 
分 母 自由 度 ”第 I 类 错误 | 5 3 4 š 6 
1 ‚01 4 052.00 4999.00 5 403.00 5 625.00 5 764.00 5 859.00 
.05 162. 00 200. 00 216. 00 225.00 230. 00 234.00 
.10 39.90 49.50 53.60 55.80 57.20 58.20 
2 ‚01 98.50 99.00 99. 17 99,25 99.30 99.33 
.05 18.51 19. 00 19.17 19.25 19.30 19.33 
. 10 8.53 9.00 9.16 9.24 9.29 9.33 
3 ‚01 34.12 30.82 29.46 28.71 28.24 27.91 
‚05 10.13 9.55 9.28 9. 12 9.01 8.94 
.10 5.54 5.46 5.39 5.34 2231 5.28 
1 ‚01 21.20 18.00 16.70 15.98 15:52 15.21 
.05 ТУҒА 6.95 6. 59 6. 39 6.26 6.16 
.10 99 4.33 4.19 4.11 4.05 4.01 
5 ‚01 16.26 13.27 12. 06 11.39 10.97 10. 67 
.05 6.61 5.79 5.41 5.19 5.05 4.95 
.10 4.06 3.78 3.62 2,52 3.45 3.41 
6 ‚01 13; 79 10.93 9.78 9.15 8.75 8.47 
.05 5.99 5.14 4.76 4.53 4.39 4.28 
.10 3.78 3.46 3.29 3.18 3.11 3.06 
J .01 12.25 9.55 8.45 7.85 7.46 219 
.05 5.59 4.74 4.35 4.12 3.97 3.87 
. 10 3.59 3.26 3.08 2.96 2.88 2.83 
8 .01 11.26 8.65 7.59 7.01 6.63 6.37 
‚05 5.32 4.46 4.07 3.84 3.69 3.58 
.10 3.46 2.1 2.92 2.81 2:73 2.67 
9 .01 10.56 8.02 6.99 6.42 6.06 5.80 
. 05 2,12 4.26 3.86 3.63 3.48 3:37 
. 10 3.36 3.01 2.81 2.69 2.61 2.55 
10 .01 10.05 7.56 6.55 6. 00 5.64 5.39 
„05 4.97 4.10 3.71 3.48 2/99 3.22 
‚10 3.29 2.93 2. 73 2.61 2.52 2.46 
11 ‚01 9.65 7.27 6. 22 5.67 5.32 5.07 
. 05 4. 85 3.98 3.59 3.36 3.20 3.10 
.10 3.23 2.86 2.66 2.54 2.45 2.39 
12 ‚01 9.33 6.93 5.95 5.41 5.07 4.82 
‚05 4.75 3.89 3.49 3.26 3.11 3.00 
.10 3.18 2.81 2.61 2.48 2.40 2.33 
13 ‚01 9.07 6.70 5.74 2:21 4.86 4.62 
.05 4.67 3.81 3.41 3.18 3.03 2.92 
‚10 3.14 2.76 2.56 2.43 2:25 2.28 
14 ‚01 8.86 6.52 5.56 5.04 4.70 4.46 
‚05 4.60 3.74 3.34 Ssl 2.96 2.85 
.10 3.10 2.73 25:92 2.40 2.31 2.24 
15 ‚01 8.68 6.36 5.42 4.89 4.56 4.32 
.05 4.54 3.68 3.29 3.06 2.90 2.79 
.10 3.07 2.70 2.49 2.36 2.27 2.21 
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续 表 
| 分 子 自 由 度 
ЖЕНЕ ”第 I 类 错误 i 5 5 s. š 6 

16 .01 8.53 6.23 5.29 4.77 4.44 4.20 
‚05 4.49 3.63 3.24 3.01 2.85 2.74 

.10 3.05 2.67 2.46 2.33 2.24 2.18 

17 .01 8.40 6.11 5.19 4.67 4.34 4.10 
‚05 4.45 3.59 3.20 2.97 2.81 2.70 

. 10 3.03 2.65 2.44 2231 2.22 2.15 

18 ‚01 8.29 6.01 5.09 4.58 4.25 4.02 
‚05 4.41 3.56 3.16 2.93 2 Т7 2.66 

.10 3.01 2.62 2.42 2.29 2.20 2.13 

19 .01 8.19 5.93 5.01 4. 50 4.17 3.94 
.05 4. 38 3.52 3.13 2.90 2.74 2.63 

.10 2.99 2.61 2.40 2.27 2.18 2.11 

20 .01 8.10 5.85 4.94 4.43 4.10 3.87 
.05 4.35 3.49 3.10 2.87 2.71 2.60 

.10 2.98 2.59 2.38 2. 25 2.16 2.09 

21 ‚01 8.02 5.78 4.88 4.37 4.04 3.81 
‚05 4.33 3.47 3.07 2.84 2.69 2:91 

.10 2.96 2.58 2.37 2:29 2.14 2.08 

22 ‚01 7.95 3.72 4.82 4.31 3.99 3.76 
.05 4.30 3.44 3.05 2.82 2.66 2.55 

10 2.95 2.56 2. 35 2.22 2.13 2.06 

23 ‚01 7.88 5.66 4.77 4.26 3.94 9/71 
.05 4.28 3.42 3.03 2.80 2.64 2,39 

.10 2.94 2.55 2.34 2.21 2,12 2.05 

24 ‚01 7.82 5.61 4.72 4.22 3, 3.67 
.05 4. 26 3.40 3.01 2.78 2.62 2.51 

. 10 2.93 2.54 2,22 2.20 2.10 2.04 

25 ‚01 7:71 95:97 4. 68 4. 18 3.86 3.63 
‚05 4.24 3.39 2.99 2.76 2.60 2.49 

.10 2:92 2.93 2.32 2.19 2.09 2.03 

26 ‚01 7. 72 5.53 4.64 4.14 3.82 3.59 
.05 4.23 3.37 2.98 2.74 2.59 2.48 

‚10 2.91 2,52 2.31 2.18 2.08 2.01 

27 .01 7.68 5.49 4.60 4.11 3.79 3.56 
.05 4.21 3.36 2.96 273 2.57 2.46 

„10 2.90 2.51 2.30 2.17 2.07 2.01 

28 ‚01 7.64 5.45 4.57 4.08 3.75 3.53 
.05 4.20 3.34 2,95 2.72 2,56 2.45 

.10 2.89 2.50 2.29 2.16 2.07 2.00 

29 .01 7.60 5.42 4.54 4.05 2,73 3.50 
‚05 4.18 3.33 2.94 2.70 2.55 2.43 

.10 2.89 2.50 2.28 2:15 2.06 1.99 

30 ‚01 7.56 5.39 4.51 4.02 3.70 3.47 
.05 4.17 3.32 2.92 2.69 2:53 2.42 

10 2.88 2.49 2.28 2.14 2.05 1.98 


一 一 


ЖЕНЕ ”第 I 类 错误 


35 


40 


45 


50 


55 


65 


70 


75 


80 


85 


95 


100 


Infinity 


.01 
‚05 
. 10 
.01 
. 05 
. 10 
.01 
. 05 
. 10 
.01 
‚05 
.10 
‚01 
‚05 
‚10 
‚01 
.05 
.10 
‚01 
‚05 
.10 
‚01 
‚05 
.10 
‚01 
‚05 
.10 
‚01 
‚05 
. 10 
‚01 
‚05 
„10 
‚01 
.05 
. 10 
.01 
‚05 
. 10 
.01 
.05 
.10 
.01 
.05 
.10 


7.42 
4.12 
2.86 
7.32 
4.09 
2.84 
7.23 
4.06 
2.82 
ТАЛ 
4.04 
2.81 
7,22 
4.02 
2.80 
7.08 
4.00 
2.79 
7.04 
3.99 
2.79 
7.01 
3.98 
2.78 
6.99 
3.97 
2.77 
3.96 
6.96 
2.77 
6.94 
3.95 
2.71 
6.93 
3.95 
2.76 
6.91 
3.94 
2.76 
6.90 
3.94 
2.76 
6.64 
3.84 
2.71 
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分 子 自由 度 
3 + 
4.40 3.91 
2.88 2.64 
2,25 2.14 

31 3.91 
84 2.64 
23 2.11 
25 3.83 
81 2.61 
21 2.09 
20... 3.71 
79 2.58 
20 2.08 
16 2.72 
77 2.56 
19 2.06 
13 3.68 
76 2.54 
18 2.05 
10 3.63 
75 2.53 
17 2.04 
08 3.62 
74 2.51 
16 2.03 
06 3.60 
73 2.50 
16 2.03 
04 2,40 
72 2.49 
15 2.02 
02 3.55 
71 2.48 
15 2.01 
02 3.54 
71 2.47 
15 2.01 
00 3.52 
70 2.47 
14 2.01 
98 3.51 
2.70 2.46 
2.14 2.00 
3.78 3.32 
2.61 2.37 
2.08 1.95 
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5 
3.59 
2.49 
2.02 
3.81 
2.45 
2.00 
3.46 
2.42 


3.41 


3.37 
2.38 
1.96 


2.37 


2.36 


3: 29 
2,35 
1.93 
3.27 


1.93 
3.26 
2,33 


2.32 


2,32 


3.22 
2.31 


3.21 
2.31 
1.91 
3.02 
2.22 


253 


续 表 


6 
3:37 
2.37 
1.95 
3.29 


1.93 
3.23 
2.31 


2.29 


2.27 


2.26 


2.24 


2.23 


2522 


2.22 


2.21 
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表 B.4 拒绝 零 假 设 需要 的 相关 系数 值 


单 侧 检验 双 侧 检验 

df .05 .01 df .05 .01 
1 .9877 .9995 1 .9969 .9999 
2 .9000 .9800 2 .9500 .9900 
3 .8054 .9343 3 .8783 .9587 
4 .7293 .8822 4 лм. .9172 
5 ‚ 6694 ‚832 5 ‚7545 . 8745 
6 .6215 .7887 6 .7067 ‚ 8343 
7 ‚5822 ‚7498 1 ‚ 6664 ‚ 7977 
8 ‚ 5494 ‚7155 8 ‚ 6319 ‚ 7646 
9 ‚5214 ‚6851 9 ‚6021 . 7348 
10 .4973 .6581 10 ‚5760 ‚7079 
11 ‚4762 ‚ 6339 11 ‚5529 ‚ 6835 
12 ‚4575 ‚6120 12 ‚ 5324 ‚6614 
13 ‚ 4409 ‚ 5923 13 ‚5139 ‚ 6411 
14 ‚4259 ‚ 5742 14 ‚ 4973 ‚6226 
15 ‚412 ‚ 5577 15 ‚4821 ‚ 6055 
16 . 4000 ‚ 5425 16 . 4683 ‚ 5897 
17 ‚ 3887 ‚5285 17 ‚4555 ‚ 5751 
18 ‚ 3783 ‚5155 18 ‚4438 ‚5614 
19 ‚ 3687 ‚5034 19 ‚4329 ‚ 5487 
20 ‚ 3598 ‚4921 20 ‚ 4227 ‚ 5368 
25 ‚ 3233 ‚4451 25 ‚ 3809 . 4869 
30 . 2960 . 4093 30 3494 ‚ 4487 
35 ‚ 2746 ‚3810 35 ‚ 3246 ‚4182 
40 ‚2573 ‚3578 40 ‚ 3044 ‚ 3932 
45 . 2428 ‚3384 45 ‚2875 ‚3721 
50 ‚ 2306 ‚3218 50 ‚2732 ‚ 3541 
60 ‚2108 ‚ 2948 60 ‚2500 . 3248 
70 ‚ 1954 ‚ 2737 70 ‚2319 ‚3017 
80 . 1829 ‚ 2565 И .2830 
90 .1726 .2422 90 .2050 .2673 
100 1638 .2301 100 .1946 .2540 


MRB KER 
ЖВ.5 卡 方 检验 的 临界 值 
显著 水 平 

df .10 .05 .01 
1 2.71 3.84 6. 64 
2 4.00 5.99 9.21 
3 6.25 7.82 11.34 
4 7.78 9.49 13.28 
5 9.24 11.07 15.09 
6 10.64 12. 59 16. 81 
7 12.02 14.07 18.48 
8 13.36 15.51 20.09 
9 14.68 16.92 21.67 
10 16.99 18.31 23.21 
11 17.28 19.68 24.72 
12 18. 65 21.03 26.22 
13 19.81 22.36 27.69 
14 21.06 23.68 29.14 
15 22.31 25.00 30. 58 
16 23.54 26.30 32.00 
17 24.77 27.60 33.41 
18 25.99 28.87 34.80 
19 27.20 30.14 36.19 
20 28.41 31.41 37.57 
21 29.62 32.67 38.93 
22 30.81 33.92 40.29 
23 32.01 35.17 41.64 
24 33.20 36.42 42.98 
25 34.38 37.65 44.81 
26 35.56 38.88 45.64 
27 36.74 40.11 46.96 
28 37.92 41.34 48.28 
29 39.09 42.56 49.59 
30 40.26 43.77 50.89 
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这 是 《 爱 上 统计 学 》 中 使 用 的 数据 集 。 这 些 数据 可 以 在 这 里 手动 录入 ,也 可 以 从 
下 面 这 个 网 址 下 载 :http://www. soe. ku. edu/faculty/ Salkind/ stats/ _fpwhs , 

注意 这 里 只 包括 数值 (如 1 和 2) ,但 是 不 包括 数值 的 标签 (如 男性 和 女性 ) 。 例 如 
第 9 章 数据 集 2 中 性 别 由 1( 男 性 ) 和 2 表示 (女性 ) 。 如 果 使 用 SPSS ,你 可 以 应 用 贴 
标签 的 功能 给 这 些 数值 分 配 标签 。 


Ж — = 


“就 如 你 们 从 这 
个 饼 图 中 所 看 到 的 ， 
我 们 消费 的 大 部 分 ， 
嗯 ,就 是 饼 ” 
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第 2 章 数据 集 1 
рге) рге) рге) рге) 
87 87 76 81 
99 77 55 82 
87 89 64 99 
87 99 81 93 
67 96 94 94 
第 2 章 数据 集 2 
scorel score2 score3 
3 34 154 
7 54 167 
5 17 132 
4 26 145 
5 34 154 
6 25 145 
7 14 113 
8 24 156 
6 25 154 
5 23 123 
第 3 章 数 据 集 1 
теас іт геас іт геас іт 
0.4 0.8 0.5 
0.7 0.9 2.1 
0.4 1,1 2.3 
0.9 1.3 0.2 
0.8 0.2 0.5 
0.7 0.6 0.7 
0.3 0.8 > 
1.9 0.7 0.9 
1.2 0.5 0.6 
2.8 2.6 0.2 
第 3 章 数 据 集 2 
height weight height weight height weight height weight 
53 156 76 171 57 154 66 156 
46 131 87 143 68 166 51 173 
54 123 65 135 65 153 58 143 
44 142 45 138 66 140 49 161 


56 156 4 114 54” 143 48 131 
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第 4 章 数 据 集 1 
comp_sci comp_sci comp_sci 
12 42 15 
15 44 16 
11 47 22 
16 54 29 
21 55 29 
25 51 54 
21 56 | 56 
53 57 
57 59 
2 49 54 
22 45 56 
26 45 43 
27 47 ® 
36 43 41 
34 31 42 
33 12 7 
38 14 
第 5 章 数据 集 1 
income educ income educ income educ 
$36 577 11 $44 321 13 $55 654 15 
854 365 12 823216 9 $76 545 14 
833 542 10 843 454 12 821 324 11 
865 654 12 864 543 12 $17 645 12 
845 765 11 843 433 14 7823 432 11 
$24 354 7 834 644 12 844 543 15 
843 233 12 $33 213 10 
第 5 章 数 据 集 2 
соттес! ай correct att 
17 94 14 85 
13 73 16 66 
12 59 16 79 
15 80 18 77 


16 93 19 91 
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第 9 章 数 据 集 1 


тетчезі group memtest group memtest 


group 


12 
15 


4 j œi ж œi œi œ үне 


第 9 章 数据 集 2 


gender 


gender hands_up 


hands_up 


hands_up 


gender 


10 


10 


12 


第 9 章 数据 集 3 


attitude group attitude 


group 


attitude 


6.5 


group 


2.4 
9,3 


13.2 


2,2 


7.9 
4.3 


6.4 


9.3 


6.8 


20 42ЖЭ% 加 上 统计 学 

















续 表 
group attitude group attitude group attitude 
l 9.9 2 12 1 5.6 
1 6.8 1 4.2 2 4.3 
1 4.8 1 7 1 6.6 
2 6.5 2 6.7 2 1 
2 243 1 6 1 5 
1 4 2 5.3 2 3 
第 10 章 数据 集 1 
pretest posttest pretest posttest pretest posttest 
3 7 6 8 9 4 
5 8 7 8 8 4 
4 6 8 7 7 5 
6 7 7 9 7 6 
5 8 6 10 6 9 
5 9 7 9 7 8 
4 6 8 9 8 12 
5 6 8 8 
3 1 9 8 
第 10 章 数 据 集 2 
before after before after before after 
20 | 23 21 26 53 51 
6 8 34 29 22 21 
12 11 33 31 34 31' 
34 35 54 56 32 33 
55 57 23 22 44 38 
43 76 33 35 17 15 
54 54 44 41 28 27 
24 26 65 56 
33 35 43 34 
第 10 章 数据 集 3 
before after before after before after 
3.9 6.5 9:8 7.9 5.6 6.9 
2,5 8.7 4.4 8.7 6.2 5.9 
2.3 9.8 7.6 9.1 7.0 7.6 
8.1 10.2 9.0 8.4 6.9 7.8 
5.0 7.9 7.6 6.4 5.6 7:2 
7.0 6.5 4.5 7:2 5,2 4.6 


7:9 8.7 1 5.8 
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第 11 章 数据 集 1 
group lang_sc group lang_sc group lang_sc 
l 87 2 87 3 89 
1 86 2 85 3 91 
1 76 2 99 3 96 
1 56 2 85 3 87 
1 78 2 79 3 89 
1 98 2 81 3 90 
1 77 2 82 3 89 
1 66 2 78 3 96 
1 75 2 85 3 96 
1 67 2 91 3 93 
第 11 章 数 据 集 2 
ргас time ргас time prac time 
l 58.7 2 58.7 3 65.9 
l 55.3 2 54.7 3 54.7 
l 61.8 2 52.7 3 53.6 
1 49.5 2 67.8 3 58.7 
1 64.5 2 61.6 3 58.7 
1 61 2 58.7 3 65.7 
l 65.7 2 54.6 3 66.5 
1 51.4 2 51;5 3 56.7 
1 53.6 2 54.7 3 55.4 
1 59 2 61.4 3 51.5 
2 64.4 2 56.9 3 54.8 
2 55.8 3 68 3 57:2 
第 12 章 数据 集 1 
Treatment Gender Loss Treatment Gender Loss 
l l 76 2 1 88 
1 1 78 2 1 76 
1 1 76 2 1 76 
1 1 76 2 1 76 
1 1 76 2 1 56 
1 1 74 2 1 76 
1 1 74 2 1 76 
1 1 76 2 1 98 
1 1 76 2 1 88 
1 1 55 2 1 78 
1 2 65 2 2 65 
1 2 90 2 2 67 
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续 表 


Treatment 


Treatment 


67 


65 


87 
78 
56 


65 


56 
54 
56 


19 
70 


第 12 章 数据 集 2 


Раіп 


Раіп 


Раіп 
Score 


Score 


Severity Treatment 


Severity Treatment Score 


Severity Treatment 
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续 表 
Раіп Раіп Раіп 
Severity Treatment Score Severity Treatment Score Severity Treatment Score 
2 1 7 2 2 3 2 3 2 
2 1 7 2 2 4 2 3 1 
2 1 6 2 2 5 2 543 3 
2 1 7 2 2 6 2 3 2 
2 1 8 2 2 7 2 3 2 
2 l 8 2 2 7 2 3 3 
2 l 8 2 2 6 2 3 4 
2 1 9 2 2 5 2 3 3 
2 1 0 2 2 4 2 3 2 
2 1 9 2 2 4 2 3 2 
2 1 8 2 2 5 2 3 1 
第 13 章 数 据 集 1 

qual_mar qual_pc qual_mar qual_pc qual_mar qual_pc 

1 58.7 2 58.7 3 65.9 

1 6523 2 54.7 3 54.7 

1 61.8 2 52:7 3 53.6 

1 49.5 2 67.8 3 58.7 

1 64.5 2 61.6 3 58.7 

1 61 2 58.7 3 65.7 

1 65.7 2 54.6 3 66.5 

1 51.4 2 51:5 3 56.7 

1 53.6 2 54.7 3 55.4 

1 59 2 61.4 3 51.5 

2 64.4 2 56.9 3 54.8 

2 55.8 3 68 3 57.2 

第 13 章 数据 集 2 
motiv gpa motiv gpa motiv gpa 

1 3.4 5 3:2 8 3.1 

6 3.4 6 2:1 8 2.5 

2 2.5 5 3:2 7 2.4 

7 3.1 5 2.7 6 2.3 

5 2.8 6 2.8 9 4 

4 2.6 6 2.6 7 3.9 

3 2.1 7 2.9 8 3.1 

1 1.6 7 2.8 2 3.3 

8 3:1 2 1.8 8 3 

6 2.6 9 3.7 9 


第 14 章 数据 集 1 
training injuries training injuries training injuries 
12 8 14 7 22 3 
3 7 26 2 24 8 
22 2 36 2 26 8 
12 5 26 2 3⁄4 2 
11 4 15 6 12 2. 
31 1 11 5 24 3 
27 5 16 7 33 3 
31 1 14 8 21 5 
8 2 15 3 12 7 
16 2 16 7 36 3 
-------------------............х JJ 
第 14 章 数 据 集 2 
time Correct time correct 
14.5 5 13.9 3 
13.4 7 17.3 12 
27 6 12.5 5 
16.4 2 16.7 4 
21 | 4 22.7 3 
aaa 
第 15 章 数据 集 1 
一 
voucher voucher voucher 
OO Op 


@ чә ш Q Q) Q) Q) Чә Чә Q) Q) Q) Q) Q) Q) Q) Q) шә Q) МӘ МӘ М Мә М М М М N) N) 
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第 15 章 数 据 集 2 


四 
D 
50 


gender 


gender 
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样本 数据 集 


test2 


test] 


group 


gender 


32 
33 


98 


87 
89 
88 


23 


76 
68 


54 


78 
98 


32 


93 


37 
43 


76 
75 


56 
78 
99 
87 
56 
78 
56 
67 


65 


76 
78 


89 
81 


78 


83 


88 


88 
81 


93 


93 


89 
86 
77 
89 


87 
80 





方差 分 析 ( Analysis of variance) ”检验 两 个 或 更 多 均值 之 间 的 差异 。 简 单方 差分 析 
( ANOVA) 只 有 一 个 独立 变量 ,而 析 因 方差 分 析 检 验 一 个 以 上 独立 变量 的 均值 。 一 元 
方差 分 析 检 验 两 个 以 上 的 群体 之 间 的 均值 差异 。 


算术 平均 值 ( Arithmetic mean) ”集中 趋势 的 一 种 测量 方法 ,也 就 是 将 数据 集 的 所 有 数 
值 加 起 来 然后 除 以 数值 的 个 数 。 | 


渐 近 性 ( Asymptotic)” 正 态 曲 线 的 性 质 ,也 就 是 曲线 的 双 尾 无 限 接近 但 永远 不 会 与 * 
轴 相 交 。 


平均 值 (Average) “一 个 数据 集 的 最 有 代表 性 的 值 。 


钟 型 曲线 (Bell-shaped curve) ”数据 的 分 布 以 中 均值 .中 位 数 和 众 数 为 中 心 是 对 称 , 而 
且 双 尾 具 有 渐 近 性 。 


组 距 ( Class interval) ”用 于 建立 频数 分 布 的 一 组 数据 的 上 限 和 下 限 。 

不 相关 系数 ( Coefficient of alienation)” 双 变量 关系 中 不 能 解释 的 方差 的 大 小 。 
决定 系数 ( Coefficient of determination) ” 双 变 量 关 系 中 可 以 解释 的 方差 的 大 小 。 
非 决 定 系数 (Coefficient of попФегеттпіпаһоп ) 见 不 相 关系 数 。 


同步 效 度 ( Concurrent validity) ”用 于 检验 测试 结果 和 同期 发 生 的 标准 的 一 致 程度 的 
效 度 类 型 。 


建构 效 度 ( Construct validity) ”用 于 检验 测试 反映 支持 测试 的 结构 的 程度 的 效 度 
类 型 。 


相关 系数 ( Correlation coefficient) ”反映 两 个 变量 之 间 关 系 的 数量 指标 。 
相关 和 矩阵 (Correlation matrix) ”相关 系数 集 。 
标准 变量 ( Criterion) ”结果 变量 的 另 一 个 名 称 。 


准则 效 度 ( Criterion validity) ”用 于 检验 测试 反映 现在 (同期 ) 发 生 的 准则 或 者 未 来 
(预测 ) 发 生 的 准则 的 程度 的 效 度 类 型 。 


临界 值 ( Critical value) ”拒绝 (不 接受 ) 零 假设 必需 的 值 。 


累计 频数 分 布 (Cumulative frequency distribution) ”以 累计 频数 反应 每 个 组 距 的 频数 的 
频数 分 布 。 
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数据 (Data) ”对 观察 值 或 事件 的 记录 ,如 考试 成 绩 、 数 学 课 中 的 等 级 或 反应 时 间 。 
数据 点 (Data point) ”一 个 观察 值 。 
数据 集 ( Data set) ”数据 点 的 集合 。 


自由 度 ( Degrees of freedom) ”对 不 同 的 统计 检验 来 说 是 不 同 的 值 ,近似 于 实验 设计 中 
每 个 格 中 的 样本 规模 。 


依赖 变量 ( Dependent variable) ”回归 方程 中 的 结果 变量 或 被 估计 变量 。 

描述 统计 ( Descriptive statistics) ”描述 样本 或 者 总 体 特征 的 值 。 

直接 相关 ( Direct correlation) ” 正 向 相关 ,也 就 是 两 个 变量 的 值 变化 的 方向 相同 。 

有 方向 的 研究 假设 (Directional research hypothesis) 包含 一 种 不 相等 陈述 的 研究 
假设 。 

效应 量 (Effect size) ”特定 结果 规模 的 测量 。 

预测 误差 (Error іп prediction) ”实际 值 (Y) 和 估计 值 (Y') 的 差异 。 

估计 误差 (Error of estimate) ” 见 预测 误差 。 

误差 值 ( Error score) ”测试 值 中 随机 的 部 分 ,也 是 由 于 不 可 信 的 测试 产生 的 部 分 。 

析 因 方差 分 析 ( Factorial analysis of variance) ”一 个 以 上 因素 或 独立 变量 的 方差 分 析 。 
因子 设计 (Factorial design) 一 个 以 上 实验 (处 理 ) 变量 的 研究 设计 。 

频数 分 布 (Frequency distribution) ”说 明 数 值 在 组 距 内 分 布 的 一 个 方式 。 

频数 多 边 图 ( Frequency polygon) ”频数 分 布 的 图 形 表示 。 

直方 图 ( Histogram) ”频数 分 布 的 图 形 表示 。 

假设 (Hypothesis) ”以 如 果 - 那 么 形式 表述 的 变量 之 间 关 系 的 推断 。 

独立 变量 ( Independent variable) ”回归 方程 中 的 可 以 控制 的 处 理 变 量 或 估计 变量 。 
间接 相关 ( Indirect correlation) ” 负 相 关 , 也 就 是 两 个 变量 的 变化 方向 相反 。 

推论 统计 ( Inferential statistics) ”用 样本 结果 推论 总 体 的 统计 工具 。 
交互 效应 (Interaction effect) ”一 个 因素 的 效应 受 另 一 个 因素 的 影响 而 产生 的 结果 。 


内 部 一 致 性 信和 度 ( Internal consistency reliability) 用 于 检验 评估 工具 一 维 性 质 ІШ ЕЗІ 
类 型 。 


评分 者 信和 度 ( Interrater reliability) ”用 于 检验 评分 者 之 间 一 致 性 的 信和 度 类 型 。 


定 距 测量 水 平 (Interval level of measurement) ”连续 数据 点 之 间距 离 相 等 的 一 种 测量 
尺度 。 


峰 度 ( Kurtosis) ”分 布 的 一 种 特征 ,也 就 是 曲线 的 平缓 和 陡峭 程度 。 
高 狭 峰 ( Leptokurtic)” 正 态 曲 线 的 一 种 性 质 , 也 就 是 定义 正 态 曲 线 的 峰 度 。 
最 优 拟 合 线 ( Line of best fit) 能 够 最 优 拟 合 实际 数值 并 将 估计 误差 最 小 化 的 回归 线 。 


线性 相关 ( Linear correlation) 可 以 用 直线 最 好 地 表示 的 相关 。 


主 效应 ( Main effect) 方差 分 析 中 ,一 个 因素 或 一 个 独立 变量 对 结果 变量 具有 显著 的 
影响 。 


均值 ( Mean) 平均 值 的 一 种 形式 ,也 就 是 将 所 有 的 观察 值 加 起 来 之 后 除 以 观察 值 的 
数量 。 


平均 偏差 或 平均 差 ( Mean deviation) ”所 有 数值 偏离 分 布 均值 的 偏差 的 平均 值 。 
集中 趋势 测量 ( Measures of central tendency) ”也 就 是 均值 .中 位 数 和 众 数 。 

中 位 数 ( Мейап) 数据 分 布 中 50% 的 个 案 在 其 之 上 50% 个 案 在 其 之 下 的 数据 点 。 
组 中 点 (Midpoint) ”组 距 的 中 点 。 

众 数 (Mode) 一 个 数据 分 布 中 出 现 次 数 最 多 的 数值 。 

多 元 回归 ( Multiple regression) ”用 多 个 变量 估计 一 个 变量 的 统计 工具 。 


定 类 测量 水 平 (Nominal level of measurement) 只 有 分 类 没有 次 序 和 大 小 的 测量 
尺度 。 


无 方向 的 研究 假设 ( Nondirectional research hypothesis) ”没有 推断 方向 只 断定 有 差异 
的 假设 。 : 

非 人 参数 统计 (Nonparametric statistics) 分布 自由 的 统计 。 

正 态 曲线 (Normal curve)” 见 钟 型 曲线 。 

零 假 设 (Null hypothesis) ”一 组 变量 相等 的 陈述 。 

观察 值 ( Observed score) ”记录 或 观察 的 值 。 

实际 值 ( Obtained value) ”应 用 统计 检验 得 到 的 值 。 

肩 形 图 ( Ogive) ”累计 频数 分 布 的 图 形 表示 。 

单 尾 ( 侧 ) 检验 (One-tailed test) 有 方向 的 检验 。 

一 元 方差 分 析 ( One-way analysis of variance) ”见方 差分 析 。 

定 序 测量 水 平 (Ordinal level of measurement) ”可 以 排序 的 测量 尺度 。 


奇异 值 (Outliers) ”数据 分 布 中 明显 的 大 于 或 小 于 大 多 数值 的 数值 。 准 确 地 说 什么 是 
奇异 值 通 常 是 由 研究 者 主观 决定 。 


平行 形式 信和 度 ( Parallel forms reliability) ”检验 相同 测试 的 不 同形 式 的 一 致 性 的 信 度 
类 型 。 


参数 统计 (Parametric statistics) ”通过 样本 推断 总 体 的 统计 。 
皮尔 森 积 距 相 关系 数 ( Pearson product-moment correlation) НЭС Ж. 
百 分 位 数 ( Percentile point) ”数值 出 现 于 本 身 或 其 下 的 数据 点 。 

低 阔 峰 ( Platykurtic) ”定义 正 态 曲 线 的 平滑 度 的 一 种 特性 。 
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总 体 (Population) 所 有 可 能 的 主体 或 者 相关 的 个 案 。 


事后 分 析 ( Post hoc) ”事后 分 析 , 是 指 通过 检验 确定 三 个 或 者 更 多 群体 之 间 差 异 的 
来 源 。 


预测 效 度 ( Predictive validity) ”用 于 检验 测试 的 结果 和 未 来 发 生 的 标准 的 一 致 性 的 效 
度 类 型 。 


估计 变量 (Predictor) ”用 于 估计 结果 的 变量 。 


极 差 (Range) ”最 大 值 减 去 最 小 值 ,是 对 变异 性 的 总 的 测量 。 不 包含 极 差 是 最 大 值 减 
去 最 小 值 。 包 含 极 差 是 最 大 值 减 去 最 小 值 然后 加 1。 


定 比 测量 水 平 (Ratio level of measurement) ”有 绝对 零 值 的 测量 尺度 。 
回归 方程 ( Regression equation) ”定义 最 接近 实际 数值 的 点 和 线 的 方程 。 
回归 线 ( Regression line) ”以 回归 方程 的 值 绘制 的 直线 。 

信和 度 ( Reliability) 测试 的 一 致 性 。 

研究 假设 ( Research hypothesis) ”两 个 变量 不 相等 的 陈述 。 

样本 (Sample) ”总体 的 一 个 子 集 。 

抽样 误差 (Sampling error) ”样本 值 和 总 体 值 之 间 的 差异 。 

测量 尺度 ( Scales of measurement) ”测量 结果 的 不 同形 式 。 


ВУ л В ( Ѕсапегргат, or scatterplot) ”配对 数据 点 构成 的 图 。 ° 
显著 水 平 (Significance level) 研究 者 在 零 假 设 为 真 的 情况 下 拒绝 零 假 设 承担 的 
风险 。 


简单 方差 分 析 (Simple analysis of variance) ”见方 差分 析 。 


偏 态 或 偏 度 ( Skew,or skewness) 分布 的 性 质 ,用 于 描述 特定 数值 的 不 成 比例 的 分 布 : 
右 侧 长 于 左 侧 意 味 着 在 分 布 的 数值 较 高 一 端 数值 出 现 的 次 数 较 少 ,这 是 正 向 偏 态 分 
布 。 右 侧 短 于 左 侧 意味 着 在 分 布 的 数值 较 高 一 端 数值 出 现 的 次 数 较 多 ,这 是 负 向 偏 态 
分 布 。 


源 表 ( Source table) 方差 分 析 中 表示 方差 来 源 的 清单 。 
标准 差 (Standard deviation) ”偏离 于 均值 的 平均 值 。 

标准 估计 误差 (Standard error of estimate) ”估计 准确 性 的 测量 。 

标准 值 (Standard score) 见 z 值 。 

统计 显著 性 ( Statistical significance) WM EKE, 

统计 学 (Statistics) ”用 于 组 织 和 人 解释 数据 的 一 系列 的 工具 和 技术 。 

再 测 信 和 度 ( Test-retest reliability) ”检验 不 同时 期 测试 一 致 性 的 信和 度 类 型 。 
检验 统计 值 (Test statistic value) MERIH. 
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真实 值 (True score) ”反映 实际 能 力 和 行为 的 观察 值 中 不 可 观察 的 部 分 。 

双 尾 ( 侧 ) 检验 (Two-tailed test) “无 方向 假设 也 就 是 差异 方向 不 重要 的 假设 的 检验 。 
第 工 类 错误 (Type I error) 零 假设 为 真 的 情况 下 拒绝 零 假设 的 概率 或 可 能 性 。 

第 I 类 错误 (Type П еггог) ” 零 假设 为 假 的 情况 下 接受 零 假设 的 概率 或 可 能 性 。 
无 偏 估计 (Unbiased estimate) ”总 体 参 数 的 保守 估计 。 

效 度 (Validity) ”测试 能 够 测试 要 测试 的 内 容 的 性 质 。 

变异 性 ( Variability) ”数据 集 离散 或 散布 的 数量 。 

方差 ( Variance) ”标准 差 的 平方 ,是 数据 分 布 的 离散 性 或 散布 的 另 一 个 量 数 。 
Ү'(Ү' or prime) 了 Y 值 的 估计 值 。 

z 值 (z score) ”依据 原始 数据 分 布 的 均值 和 标准 差 来 调整 的 原始 数值 。 


